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MOLECULES D'ACIDES NUCLEIQUES CODANT UNE DEXTRANE- 

SACCHARASE CATALYSANT LA SYNTHESE DE DEXTRANE 
PORTANT DES RAMIFICATIONS DE TYPE ALPHA- 1 ,2 OSIDIQUES 

5 

La pr6sente invention releve du domaine de la 
glycotechnologie et plus particulierement de la synthese d'oligosaccharides 
ou oligosides a effet prebiotique, therapeutique ou diagnostique. 

La presente invention porte sur des molecules d'acides 

10 nucleiques codant une enzyme ayant une activite de glycosyltransferase 
catalysant la synthese de dextranes ou d'oligosides portant des 
ramifications de type a(1 -> 2) osidiques. 

L'invention porte en outre sur les enzymes synthetisees par 
les acides nucleiques selon Finvention, ainsi que sur leurs systemes 

15 d'expression dans des cellules procaryotes ou eucaryotes. Elles portent 
enfin sur Tutilisation desdites enzymes dans la production 
d'oligosaccharides dans I'alimentation, ou en tant que principe actif de 
produits therapeutiques et/ou cosmetiques. 

Les oligosides et heterooligosides jouent le role de signaux de 

20 reconnaissance et d'effecteur chez Tanimal comme dans les plantes (on 
parle alors d'oligosaccharines), en se liant specifiquement a des lectines, 
des glycosyltransferases, des glycosidases, des molecules d'adhesion, 
etc... Ainsi, les determinants antigeniques des groupes sanguins sont des 
osides, et notre defense contre nombre de bacteries pathogenes est dirigee 

25 contre les structures osidiques de I'enveloppe bacterienne. Par ailleurs, 
Tune des raisons majeures du rejet des xenogreffes est Pexistence de 
structures osidiques propres a chaque espece. Ces proprietes, ainsi que 
les connaissances acquises ces dernieres annees sur les 
glycosyltransferases et les lectines, contribuent a faire de certains 

30 oligosides des candidats de choix pour la therapeutique ou la prophylaxie 
des desordres lies a Tequilibre microbiologique de differents organes tels 
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I'intestin, ou la peau. Par exemple, les oligosides constituent une alternative 
interessante a I'utilisation de microorganismes et d'antibiotiques pour 
reguler la composition de la flore intestinale (effet prebiotique). Certains 
oligosides peuvent etre consideres comme des "fibres solubles" lorsqu'ils 
5 ne sont pas metabolises par les enzymes digestives humaines et 

animales ; en gagnant le colon, ils interagissent avec la flore microbienne et 
affectent specifiquement la croissance et Padhesion de certaines especes. 
Incorporees a faible dose (moins de 1 %) dans I'alimentation, certaines de 
ces molecules osidiques ameliorent I'etat de sante et stimulent la prise de 
1 0 poids des animaux. 

Une revue des differentes glycosyltransferases, leur structure 
et leur activite, est decrite dans Vincent Monchois et a/. (1). Brievement : 

a) II apparait que la structure des glycosyltransferases et/ou 
dextrane-saccharases etudiees est tres conservee et est constitute, 

15 partant de la partie aminee de la proteine, d'une sequence signal, d f un 
domaine variable, d'un domaine catalytique et d'un domaine de liaison au 
glucane. 

b) Les glucooligosides (GOS) sont synthetisables par des 
glycosyltransferases telles les dextrane-saccharases, a partir de substrats 

20 peu couteux tel le saccharose et en presence d'un sucre accepteur de 
glucose. D*autres substrats, tels I'a-D-fluoro-glucose, le paranitrophenyl-a- 
D-glucopyranoside, Ta-D-glucopyranoside-a-D-sorbofuranoside ou le 4-0- 
a-D-galactopyranosylsucrose peuvent egalement etre utilises. 

Ces enzymes catalysent a partir du substrat le transfert 

25 d'unites glucose sur des molecules acceptrices. En presence d'un 
accepteur de glucose tel le maltose, ou Tisomaltose, les 
glycosyltransferases catalysent la synthese d'oligosaccharides de bas 
poids moleculaire comprenant majoritairement des chames de 3 a 7 
glucoses, selon la reaction : 

30 saccharose + accepteur ► accepteur glucosyle + fructose 
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En pareil cas, les enzymes presentent generalement une 
specificite de synthese de liaisons osidiques conformes a celle formant le 
polymere donneur. 

En revanche, en absence d'accepteur, I'enzyme synthetise 
5 des glucanes de haut poids moleculaire de type dextrane par transferts 
successifs d'unites a-D-glucopyranosyles a partir de saccharose, 
conformement a la reaction : 

n saccharose ► (glucose) n + n fructose 

c) Les structures et la fonction des glucanes ou des oligosides 
10 synthetises par les glycosyltransferases dependent de la souche 
bacterienne productrice. 

Dans I'ensemble de ce texte, on appellera de fa?on generique 
des glycosyltransferases les differentes enzymes capables de catalyser la 
synthese de polymeres de glucose a partir de saccharose. Elles sont 
15 generalement produites par des souches bacteriennes de type 
Leuconostoc, Lactococcus, Streptococcus ou Neisseria. La taille et la 
structure des glucanes produits dependent de la souche productrice. 

Les unites de glucose sont couplees par des liaisons 
osidiques a(1->6) comme dans le dextrane, par des liaisons <x(1->3), 
20 comme dans le cas du mutane, ou par une alternance des deux types 
(alternane). 

De la meme fa?on, Texistence et la nature des ramifications, 
leur longueur et leur position varient selon Torigine de la souche 
productrice. 

25 Les glycosyltransferases produisant des glucanes ou des 

GOS contenant au moins 50 % de liaison a(1->6) sont appelees dextrane- 
saccharases. Les GOS synthetises par ces enzymes portent, le cas 
echeant, des ramifications a(1->2), a(1-»3) et/ou a(U4). Lesdites 
dextrane-saccharases sont produites notamment par des bacteries de type 

30 Leuconostoc mesenteroides. 



WO 02/074943 




PCT/FR02/00951 



- 

4 

d) La dextrane-saccharase de L. mesenteroides NRRL B- 
1299 a la particularity de produire, quant a elle, un dextrane hautement 
ramifie dont la majorite des ramifications sont de type a(1->2). Utilisee en 
presence de saccharose et de maltose, molecule acceptrice de glucose, 

5 elle conduit a la formation de GOS presentant pour certains une liaison 
a(1-»2) a leur extremite non reductrice et pour d*autres des ramifications 
a(1->2) -sur les residus intermediates entre les extremites. A ce titre, ils 
resistent a la degradation par les enzymes (hydrolases) du tractus digestif 
superieur, chez Phomme et I'animal, et ne sont degrades que par des 

10 genres bacteriens capables de fermenter tels Bacteroides et 
Bifidobacterium, consideres comme benefiques pour I'organisme de I'hote. 

Un phenomene identique se produit au niveau de la peau, 
permettant d'envisager des applications en cosmetologie, car c'est le 
desequilibre de la flore microbienne cutanee qui est a I'origine de nombreux 

15 problemes cosmetiques et dermatologiques. C'est en raison de ces 
caracteristiques qu'ils sont designes ici par le terme GOS d'interet 

Dans Tensemble du texte, les polysaccharides synthetises par 
les glycosyltransferases selon Tinvention sont soit des dextranes de haut 
poids moleculaire lorsque la reaction est realisee sans accepteur de 

20 glucose, soit des oligosides lorsque la reaction est realisee en presence 
d'accepteur de glucose tel le maltose ou Tisomaltose sans que cela soit 
necessairement specifie. En effet, la fonctionnalite de Tenzyme est 
caracterisee par la nature des liaisons glucose-glucose [<x(1->6) f a(1-^2)] 
ou autres et non par le poids moleculaire du polysaccharide synthetise. 

25 Les dextrane-saccharases de L. mesenteroides trouvent deja 

de nombreuses applications dans I'industrie, et en particulier celles de la 
souche NRRL B-1299 pour lesquelles un procede de synthese des GOS 
presentant des ramifications a(1->2) a ete d6crit dans le brevet 
EP 0325 872 B1. 

30 Marguerite Dols et al. (2) ont montre que les GOS produits par 

les dextrane-saccharases de cette souche sont en fait un melange d'au 
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moins trois families de molecules similaires different de fait par le nombre 
et le positionnement des ramifications de type <x(1-»2), ce qui amene 
I'hypothese de Pexistence de differentes activites enzymatiques de type 
glycosyltransferase dans cette souche bacterienne. 
5 Compte tenu de Tinteret industriel dans le domaine des 

aliments prebiotiques, en cosmetologie ou en pharmacie des GOS 
presentant des ramifications a(1^2) et rappele ci-dessus, la presente 
invention vise a isoler et caracteriser une enzyme particultere parmi celles 
produites par L mesenteroides NRRL B-1299 qui serait plus 

10 particulierement impliquee dans la synthese d'oligosides presentant les 
ramification a(1->2). ^identification et la caracterisation d'une telle enzyme 
offrent I'avantage, d'une part, de fournir un procede de production uniforme 
et reproductible des GOS d'interet et, d'autre part, d'identifier les 
caracteristiques essentielles de Tenzyme productrice de ces GOS d'interet, 

15 afin, le cas echeant, d'ameliorer les performances des produits de la 

reaction enzymatique en fonction de ('utilisation envisagee. 

Le probleme technique sous-tendu dans la presente invention 
etait ainsi de pouvoir disposer d'une enzyme et done des acides nucleiques 
isoles codant cette enzyme permettant la production amelioree de GOS a 

20 ramifications a(1 ->2). 

La presente invention apporte une solution technique aux 
differentes questions evoquees ci-avant en fournissant une nouvelle 
dextrane-saccharase, appelee DSR-E codee par un gene dote d'une 
structure nouvelle et inattendue (dsrE) et capable de catalyser la synthese 

25 des glucanes ou des oligosaccharides contenant des ramifications a(1-+2). 

Entre la date de depot de la demande de brevet franpais 
N°01 03631, dont la priorite est revendiquee et dans laquelle la dextrane- 
saccharase objet de Tinvention etait appelee DSR-D, et celle de la presente 
demande, une autre dextrane-saccharase, diff6rente de Tenzyme objet de 
- 30 invention, a ete decrite et egalement nommee DSR-D. C'est pourquoi, 
dans le cadre de la presente demande de brevet, la dextrane-saccharase 
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d^crite, revendiquee et representee a la figure 1b) est denommee non plus 
DSR-D comme dans le document de priorite, mais DSR-E. De fait, les 
dextrane-saccharases DSR-D selon ledit document de priorite et DSR-E 
sont en tout point identiques. 
5 Par structure nouvelle et inattendue, on entend le fait que 

I'organisation de la proteine differe de celle de toutes les autres 
glycosyltransferases decrites a ce jour (1) et dont le domaine catalytique 
est situe en amont d'un domaine de liaison au glucane, ce dernier 
constituant la partie carboxylique de la proteine. 

10 Ainsi, la presente invention porte sur un polypeptide isole 

ayant une activite enzymatique de glycosyltransferase apte a former des 
dextranes presentant des ramifications ct(1->2), caracterise en ce qu'il 
comprend au moins un domaine de liaison au glucane et un domaine a 
activite catalytique situe en aval du domaine de liaison au glucane. Par 

15 situe en aval, on entend le fait que la partie aminee de la sequence a 
activite catalytique ou domaine catalytique est proximate de la partie 
carboxylique du domaine de liaison au glucane. Ces deux domaines 
peuvent etre immediatement contigus ou au contraire separes par une 
region variable. 

20 La glycosyltransferase selon I'invention comporte de 

preference un peptide signal. 

Dans un mode de realisation de invention, la 
glycosyltransferase comprend deux domaines catalytiques situes de part et 
d'autre du domaine de liaison au glucane. 

25 La presence d'un domaine a activite catalytique dans la partie 

carboxylique de I'enzyme est une caracteristique essentielle de cette 
derniere dans sa capacite a former des liaisons a(1->2) osidiques. En effet, 
comme le montrent les experiences decrites ci-apres, la deletion de ce 
domaine dans une enzyme ayant au moins deux domaines catalytiques 

30 conduit a la production de glucanes ou d'oligosides ayant essentiellement 
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des liaisons osidiques de type a(1->6) et depourvus de liaisons de type 

ct<1->2). 

Plus precisement, le domaine catalytique, des lors qu'il est 
situe en aval d'un domaine de liaison au glucane, permet la synthese 
5 d'oligosides contenant des liaisons a(1-»2). 

En outre, les experiences decrites ci-apres demontrent que la 
specificite de fonction de la dextrane-saccharase DSR-E, a savoir sa 
capacity a catalyser la formation de liaisons osidiques a(1->2) est 
imputable, non pas a la presence concomitante de deux domaines 
10 catalytiques, mais plutot a renchamement d'un domaine de liaison au 
glucane et d'un domaine catalytique, et plus particulierement du domaine 
catalytique CD2. 

L'analyse comparative des differentes glycosyltransferases 
incluant les dextrane-saccharases a mis en evidence un tres fort degre de 
1 5 conservation de leur domaine catalytique. 

Le domaine catalytique situe dans la partie carboxy-terminale 
de la glycosyltransferase selon invention a une sequence presentant au 
moins 44 % d'identite et 55 % de similarity avec les domaines catalytiques 
des autres glycosyltransferases analysees. En particulier, le domaine 
20 catalytique dans la partie carboxylique de la glycosyltransferase selon 
Tinvention a au moins 65 % d f identite et au moins 80 % de similarity avec la 
sequence ID No. 1, la triade catalytique Asp/Glu/Asp en positions 
respectives 230/268/342 etant conservee. 

Dans Pensemble du texte, on entend par X% de similarity par 
25 rapport a une sequence de reference le fait que X % des acides amines 

sont identiques ou modifies par substitution conservative telle que definie 
dans le logiciel d'alignement des sequences d'acides amines ClustalW 
(http:///bioweb.pasteur.fr/docs/doc-qensoft/clustalw//) et que (1 00-X) % 
peuvent etre deletes, substitues par d'autres amino-acides, ou encore que 
30 (100-X) % peuvent etre ajoutes a la sequence de reference.Une structure 
primaire particuliere de Penzyme selon Tinvention est representee dans la 
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sequence ID No. 2 qui repr§sente une sequence de 2835 acides amines 
d'une dextrane-saccharase de L. mesenteroides NRRL B-1299. 

Cette dextrane-saccharase, nommee DSR-E, possede 
comme la plupart des glycosyltransferases et des dextrane-saccharases 
5 une sequence signal, une region variable faiblement conservee, un 

domaine catalytique hautement conserve (CD1), un domaine de liaison au 
glucane.(GBD) et un deuxieme domaine catalytique (CD2) dans la partie 
carboxylique de la proteine. DSR-E est la premiere glycosyltransferase 
analysee et presentant deux domaines catalytiques, dans la configuration 

10 presentee dans la figure 1 b). C'est egalement la premiere 
glycosy transferase dont un domaine catalytique est situe dans la partie 
carboxylique de la proteine. 

La figure 1b) fait apparaTtre egalement que le domaine de 
liaison au glucane est sensiblement plus long que celui decrit 

1 5 precedemment pour les dextranes saccharases connues ; ainsi, une autre 

caracteristique des enzymes selon I'invention est la taille de ce domaine qui 
est superieur a 500 amino-acides. 

La comparaison et I'analyse de la sequence de DSR-E avec 
les sequences des glycosyltransferases ou des dextrane-saccharases deja 

20 decrites (1), ainsi que les moyens utilises a cette fin sont indiques dans 
I'exemple 2 detaille ci-apres. II y apparait clairement que si Texistence de 
deux domaines catalytiques differencie substantiellement DSR-E des 
autres enzymes, en revanche les sequences desdits domaines sont 
substantiellement conservees. En particulier, les acides amines 

25 necessaires a Tactivite catalytique sont conserves dans le deuxieme 

domaine catalytique, a savoir la triade Asp/Glu/Asp situee aux positions 
respectives 2210/2248/2322 de la sequence ID No. 2. 

Ainsi, I'tnvention porte egalement sur tout polypeptide isole 
ayant une activite catalytique de glycosylstransferase apte a former des 

30 dextranes ou des oligosaccharides ayant des ramifications <x(1->2) tel 
qu'obtenu par modification, substitution, insertion ou deletion de sequences 
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d'amino-acides mais comportant des sequences presentant au moins 80 % 
et de preference au moins 90 % de similarity avec les sequences suivantes 
de la sequence ID No. 2 : 

423-439 2120-2138 
478-501 2161 -2184 

519-539 2202-2214 
560 - 571 2243 - 2250 

631 -645 2315-2322 
1014- 1021 2689-2696 



De fagon preferee, enfin, un polypeptide a activite catalytique 
selon invention contient les acides amines suivants : 
W en positions 425 et 2122, 
E en positions 430, 565 et 2127, 2248, 
15 D en positions 487, 489, 527, 638, 2170, 2172, 2210 et 

2322, 

H en position 637 et 2321, 
Q en position 1019 et 2694. 
Les polypeptides a activite de glycosyltransferases aptes a 

20 former des liaisons osidiques a(1->2) peuvent se presenter sous forme 
isolee, ou au contraire integres dans une proteine plus large, comme par 
exemple une proteine de fusion. II peut etre en effet avantageux d'inclure 
des sequences presentant une autre fonction, comme par exemple une 
sequence etiquette specifique d'un ligand permettant d'en faciliter la 

25 purification. Ces sequences etiquettes peuvent etre du type GST 
(glutathion-S-Transferase), Inteine - CBD (Chitine-Binding Domaine), 
(commercialise par New England Biolabs, http://www.neb.com), MBD 
(Maltose Binding Domain), polypeptides contenant des residus histidine 
contigus permettant de faciliter la purification du polypeptide avec lequel il 

30 est fusionn6. L'homme du metier peut concevoir toute autre proteine de 
fusion permettant d'associer la fonction de la DSR-E de Pinvention avec 
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une autre fonction, comme par exemple, et sans etre limitattf, une 
sequence augmentant la stabilite de Tenzyme produite par expression dans 
un hote recombinant ou une sequence apte a augmenter la specificite ou 
Tefficacite d'action de cette enzyme, ou une sequence visant a associer 
5 une autre activite enzymatique connexe. 

De telles proteines de fusion font egalement partie de 
Tinvention des lors qu'elles contiennent le domaine CD2 et le site de liaison 
au glucane. De la meme fa?on, les fragments de la sequence ID No. 2, 
comprenant au moins la sequence ID No. 1 et le domaine de liaison au 

10 glucane, seuls ou integres dans une sequence polypeptidique plus large 
font partie de Tinvention, a partir du moment ou Tactivite enzymatique de 
dextrane-saccharase est conservee. 

Les variants des sequences polypeptidiques definies ci- 
dessus font egalement partie de Tinvention. Outre les polypeptides obtenus 

15 par substitution conservative des acides amines telle que definie plus haut, 

les variants incluent des polypeptides dont Tactivite enzymatique est 
amelioree par exemple par mutagenese dirigee ou aleatoire, par evolution 
moleculaire, ou par duplication du domaine catalytique CD2. 

La structure particuliere de cette enzyme identifiee dans la 

20 presente invention resulte d'un processus comprenant : 

a) Identification et Tisotement de la dextrane-saccharase de 
L mesenteroides catalysant la production des GOS d'interet portant les 
ramifications a(1-*2) ; 

b) le sequengage de fragments de Tenzyme ; 

25 c) la synthese d'amorces d'amplification aptes a amplifier le 

gene correspondant de la souche productrice ou des fragments de ceux-ci ; 

d) le sequengage des fragments amplifies ; 

e) le clonage dans des vecteurs specifiques et leur expression 
dans des hotes appropries. 

30 Les modalites du procede mis en oeuvre sont detaillees dans 

la partie experimentale ci-apres. La premiere etape consiste en une 
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separation des proteines par electrophorese en gel de polyacrylamide, et 
identification des bandes presentant I'activite de dextrane saccharase par 
une reaction enzymatique in situ en presence de substrat et d'accepteur. 
La nature des GOS synthetises est ensuite identifiee sur chaque bande par 
5 analyse HPLC selon les methodes decrites dans (1). Le temps de retention 
des oligosides en HPLC depend de la nature et de Torganisation de leurs 
liaisons • osidiques. II est possible en particulier de distinguer ceux 
constitues de residus lies en a(1-»6), en a(1-»6) avec une ramification 
a(1-»2) a I'extremite non reductrice de la molecule, et ceux recherches 
10 composes d'une chaine lineaire a(1->6) avec des ramifications a(1->2). 

Les inventeurs ont done isole et identifie la dextrane- 
saccharase de L mesenteroides NRRL B-1299 productrice des GOS 
d'interet. 

Un procede d'ingenierie reverse mis en oeuvre dans les 

15 etapes b) a e) ci-dessus a permis ensuite de fournir la sequence 
nucleotidique codant Tenzyme et permettant de la produire en quantite 
industrielle et le cas echeant de la modifier, d'en ameliorer ses 
performances par les techniques a la disposition de Thomme du metier. A 
titre d'exemple, on peut citer la mutagenese dirigee ou aleatoire, ou 

20 revolution moleculaire (DNA shuffling) (3). 

Un autre aspect de Tinvention porte sur une molecule d'acide 
nucleique isolee codant une enzyme a activite glycosyltransferase apte a 
former des dextranes ou des oligosides presentant des ramifications 
<x(1->2) et comprenant au moins une sequence codant un domaine de 

25 liaison au glucane, et au moins une sequence nucleotidique codant un 

domaine catalytique situe en 3 1 de la precedente, ladite sequence codant 
un domaine catalytique ayant au moins 50 % et de preference au moins 
70 % de similarity avec la sequence ID No. 3. 

Par similarity, on entend le fait que, pour un meme cadre de 

30 lecture, un triplet donne est traduit par le meme acide amine. Ce terme 
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inclut done les modifications de bases resultant de la degenerescence du 
code genetique. 

Le pourcentage de similarite est determine en comparant une 
sequence donnee avec la sequence de reference. Lorsque celles-ci sont de 
5 longueurs differentes, le pourcentage de similarite est base sur le 
pourcentage de nucleotides de la sequence la plus courte similaires a ceux 
de la sequence la plus longue. 

Le degre de similarite peut etre determine 
conventionnellement par utilisation de logiciels tels le ClustalW (Thompson 

10 et a/., Nucleic Acid Research (1994), 22 : 4673-4680) distribues par Julie 
Thompson ( Thompson@EMBL-Heidelberq.DE ) et Toby Gibson 
( Gibson@EMBL-Heidelberg.DE) du Laboratoire Europeen de Biologie 
Moleculaire, Meyerhosfstrasse 1, D-69117 Heidelberg, Germany. ClustalW 
peut aussi etre charge a partir de plusieurs sites web incluant IGBMC 

15 (Institut de Genetique et de Biologie Moteculaire et Cellulaire, BP. 163, 

67404 lllkirch cedex France; ftp://ftp-iqbmc. u-strabq ,f r/pub/) et EBI 
( ftp://ftp.ebi.ac.uk/pub/software/) et tous les sites renvoyant a Hnstitut de 
Bioinformatique (Wellcome Trust Genome Campus, Hinxton, Cambridge 
CB10 1SD, UK). 

20 Les acides nucleiques isoles selon I'invention peuvent 

comprendre notamment d'autres sequences destinees a ameliorer 
Texpression et/ou Tactivite de Tenzyme produite. 

II peut s'agir a titre d'exemple : 

- des sequences codant une sequence signal pour leur 

25 secretion ; 

- une duplication de la sequence codant le domaine 
catalytique CD2. 

De fa9on preferee, un acide nucleique isole selon I'invention 

comprend : 
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a) deux sequences codant des domaines catalytiques ayant 
au moins 50 %, et de preference au moins 80 % de similarity avec la 
sequence ID n° 3 ; 

b) une sequence codant le domaine de liaison au glucane, 
5 cette derniere etant situee de preference entre les deux sequences en a). 

Un acide nucleique selon Tinvention pourra comprendre en 

outre : * 

- un promoteur, apte a son expression dans une cellule hote 

choisie, 

10 - une sequence codant un peptide signal, et/ou 

- une ou des sequences variables, 

cette ou ces sequence(s) etant toutes situees en partie 5' des 
sequences codant le ou les domaine(s) catalytique(s). 

Un exemple particulier d'un acide nucleique isole selon 
15 Tinvention comprend plus particulierement : 

a) la sequence ID No. 4, 

b) une sequence presentant au moins 80 % de similarity avec 
la sequence ID n° 4, ou 

c) le brin complementaire de la sequence a) ou b), ou 
20 d) une sequence hybridant a), b) ou c). 

L'hybridation en d) est realisee en conditions standard, et de 
preference en conditions stringentes. Par hybridation en condition 
stringente, on entend le fait qu'il existe une identite de sequences d'au 
moins 80 % de la sequence que Ton cherche a hybrider et de preference 
25 une identite d'au moins 90 % de la sequence que Ton cherche a hybrider, 

dans des conditions decrites par exemple dans Sambrook et Russel 
(3* me edition, 2001, Cold Spring Harbour Laboratory Press, Cold Spring 
Harbour, NY). 

L'invention porte egalement sur un gene codant une dextrane- 
30 saccharase apte a former au moins 15 % de ramifications ot(1->2). Outre la 
sequence codante, le gene comprend les sequences permettant Tinitiation 
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de la transcription ainsi que les sequences permettant Pattachement de 
TARN messager au ribosome (RBS). La sequence ID No. 5 represente une 
structure du gene tel qu'isole de L mesenteroides NRRL B-1299. 

Les nucleotides en amont de I'ATG d'initiation de la traduction 

5 sont numerates 1 a 232. 

On peut identifier I'existence d'une sequence RBS entre les 
nucleotides 218 et 223, ainsi que les sequences consensus - 35 et - 10 
situees entre les nucleotides 82 et 86 (TTGAA), d'une part et 100 et 105 
(ATAAAT), d'autre part. 

10 Toute sequence d'acide nucteique hybridable avec I'ADN de 

la sequence ID No. 4 ou son brin complementaire est susceptible de coder 
une enzyme ayant les proprietes et caracteristiques de I'enzyme selon 
I'invention. Ceci s'applique tant aux sequences naturelles existant dans 
d'autres micro-organismes que L mesenteroides NRRL B-1299 et isolees 

15 de banques genomiques de microorganismes, que celles preparees par 
genie genetique ou par synthese chimique. 

En particulier, les sequences en amont de I'ATG d'initiation de 
la traduction et necessaires a I'expression de la proteine peuvent etre 
avantageusement substitutes par des sequences d^nitiation de la 

20 transcription et/ou de fixation au ribosome adaptes au systeme 
d'expression choisi pour la sequence codante. 

Une sequence d'acides nucleiques susceptible de s'hybrider 
en condition stringente avec I'acide nucleique isole selon Tinvention 
comprend egalement des fragments, des derives, ou des variants alleliques 

25 de la sequence d'acides nucleiques selon I'invention qui code une proteine 
ayant I'activite enzymatique decrite ci-avant Ainsi, les fragments sont 
definis comme des fragments de molecules d'acides nucleiques 
suffisamment longs pour coder une proteine ayant conserve son activite 
enzymatique. Celle-ci inclut aussi bien des fragments depourvus de la 

30 sequence codant le peptide signal responsable de la secretion de la 
proteine. 
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Le terme "derive" signifie sequence, differente de la sequence 
originelle, a une ou plusieurs positions, mais presentant un haut degre de 
similarity avec ces sequences. Dans ce contexte, similarite signifie une 
identite d'au moins 80 % des nucleotides, et de preference d'au moins 
5 90 % avec la sequence originelle. Les modifications dans ce cas portent 
sur des deletions, substitutions, insertions ou recombinaisons, a partir du 
moment, ou I'enzyme codee par ces sequences homologues presentent 
I'activite enzymatique des polypeptides selon I'invention. 

Les sequences d'acides nucleiques selon invention telles que 

10 decrites ci-dessus et qualifiees de derives de ces molecules telles que 
definies ci-avant, sont generalement des variants exergant la m§me 
fonction biologique. Ces variations peuvent etre des variations naturelles, 
notamment celles observables d'une espece a Tautre et resultant d'une 
variability inter espece ou au contraire etre introduites par le moyen d'une 

1 5 mutagenese dirigee, aleatoire ou par DNA Shuffling (evolution moleculaire). 

De la meme fagon, font partie de Tinvention les acides 
nucleiques isoles codant une glycosyltransferase apte a catalyser la 
synthese de dextrane ou d^ligosaccharide portant au moins 20 % et de 
preference au moins 30 % de ramifications de type a(1->2) et obtenus par 

20 evolution moleculaire (DNA shuffling) et comprenant : 

- une etape de modification aleatoire d'une des sequences 
decrites precedemment et, en particulier, des sequences ID Nos. 3 et 4 et 
d'etablissement de variants ; 

- une etape d'expression de ces sequences modifiees dans 
25 une cellule hote appropriee, un hote abritant un variant ; 

- une etape de criblage des hotes exprimant une enzyme apte 
a former plus de 20 % et de preference plus de 30 % de liaisons <x(1 -> 2) 
sur un substrat approprie et une etape d'isolement du ou des genes 
ameliores. 

30 Un acide nucleique isole selon Tinvention pourra egalement 

comprendre : 
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a) une sequence ayant au moins 80 % de similarity avec la 
sequence codant une dextrane-saccharase exprimee par le plasmide pCR- 
T7-dsrE dans E. coli depose a la CNCM le 15 mars 2001 sous le numero I- 
2649 (E. coli JM 109 [pCR-T7-dsrf)]), ou 
5 b) une sequence complementaire de la sequence en a). 

La denomination de la souche transformee par le plasmide 
recombinant pCR-T7-cterE et deposee a la CNCM est celle indiquee ci- 
dessus entre parentheses. Cela n'affecte pas le changement de 
denomination du gene opere ulterieurement au depot de ladite souche pour 
10 les raisons evoquees supra. 

L'invention porte egalement sur les fragments d'acides 
hucleiques tels que definis ci-dessus, hybridables avec la 
sequence ID No. 4, et utilisables comme sondes d'hybridation pour la 
detection de sequences codant des enzymes selon l'invention. Ces 
15 fragments peuvent etre prepares par toutes les techniques connues de 

Thomme du metier. 

Outre les sondes d'hybridation, des amorces d^mplification 
font egalement partie de I'invention. Lesdites amorces sont des fragments 
hybridables avec la SEQ ID No. 4 ou avec son brin complementaire et 
20 permettent ('amplification de sequences specifiques codant des dextrane- 

saccharases presentes dans un organisme procaryote ou eucaryote, 
animal ou vegetal. 

L'utilisation de telles amorces d^mplification permet la mise 
en oeuvre d'un procede d'identification de Texistence eventuelle d'un gene 
25 codant une enzyme apte a catalyser la synthese de GOS avec des 

ramifications a(1->2) dans un tel organisme, ledit procede faisant 
egalement partie de Tinvention. 

^invention porte egalement sur des vecteurs depression 
comprenant un acide nucleique tel que decrit ci-avant, sous le controle de 
30 sequence permettant son expression et de preference son excretion dans 
des cellules procaryotes ou eucaryotes. Par cellules procaryotes, on 
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choisira de preference des bacteries choisies dans un groupe comprenant 
E. co// t les Lactococcus, les Bacillus, les Leuconostoc. Par cellules 
eucaryotes, on choisira de preference les eucaryotes choisis dans un 
groupe contenant les levures, les champignons ou les vegetaux. 

Le vecteur comprend un promoteur adapte a Texpression de 
I'acide nucleique isole selon l'invention dans le systeme depression choisi. 
A titre -d'exemple, le promoteur du bacteriophage T7 pourrait etre 
avantageusement choisi pour une expression dans E. coli. 

L'invention porte egalement sur les cellules hotes, procaryotes 
ou eucaryotes, transformees par un acide nucleique selon (Invention de 
preference compris dans un vecteur depression portant un promoteur, 
adapte a une expression dans les cellules hdtes choisies. Les cellules 
transformees sont choisies dans le groupe des bacteries a Gram- telle E. 
coli, ou dans le grcupe des bacteries a Gram+ telles Lactococcus, Bacillus, 
Leuconostoc ou parmi les eucaryotes dans un groupe comprenant les 
levures ou les champignons, ou les vegetaux. 

Un exemple particulier d'une cellule transformee selon 
l'invention est la souche E. coli hebergeant un plasmide appele PCR- 
T7dsrE et porteur de la sequence ID No. 4 sous le controle du promoteur 
du bacteriophage T7 et deposee a la CNCM le 15 mars 2001 sous le 
numero I-2649. 

La presente invention, par ailleurs, porte sur un procede de 
production d'une glycosyltransferase apte a former des dextranes ou des 
oligosides presentant au moins 15 % et de preference au moins 20 % de 
ramifications de type a(1->2) osidiques et comprenant : 

a) Tinsertion d'un acide nucleique ou d'un vecteur tel que 
decrit precedemment dans une cellule hote apte a Texprimer et de 
preference a secreter la glycosyltransferase ; 

b) la caracterisation de Tactivite enzymatique recherchee par 
toutes les methodes accessibles a Thomme du metier ; 

c) la purification de Tenzyme a partir d'un extrait cellulaire. 
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Par methode de caracterisation de I'activite enzymatique 
connue de rhomme du metier, on comprendra les methodes decrites dans 
la litterature par exemple dans la reference (2) ainsi que de nouvelles 
methodes susceptibles d'etre mises au point permettant d'identifier et de 
5 discriminer les glucooligosaccharides presentant le taux de ramification 

recherche. 

II s'agit en fait de tout procede de criblage permettant 
d'identifier la presence de ramifications a(1-»2) dans un GOS. 

A titre d'exemple, seront utilisees : 
10 - I'HPLC pour lequel la migration des GOS varie en fonction 

de la nature et le positionnement des ramifications, notamment ceux ayant 
le lien a(1-»2) a I'extremite reductrice et ceux ayant ce lien sur I'avant- 
dernier glucose, et/ou 

- la Resonance magnetique nucleaire (RMN), 

15 - I'existence d'une reaction positive avec des anticorps 

monoclonaux specifiques des liaisons a(1->2) sur Pextremite reductrice 
et/ou d'anticorps monoclonaux specifiques des liaisons a(1->2) sur I'avant- 
dernier glucose du GOS. 

^invention porte egalement sur un procede d'obtention d'une 

20 glycosyltransferase apte a presenter des oligosides ou des dextranes 
presentant un taux de ramification a(1-»2) superieur a 15% et de 
preference superieur a 30 % de la totalite des liaisons osidiques et 
comprenant une etape de modification de la sequence ID No. 4 par 
addition, deletion, mutation a partir du moment ou : 

25 - le cadre de lecture n'est pas modifie, et 

- les acides amines suivants sont conserves apres traduction : 

W en positions 425 ou 2122, code par le triplet TGG en 
positions 1273 et 6364, 

E en positions 430, 565, 2127 et 2248 codes par les 
30 triplets GAA en positions 1288, 1693, 6379 et 6742 respectivement, 
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D en positions 487, 489, 527, 638, 2170 et 2210 codes par 
les triplets GAT en positions 1459, 1465, 1579, 1912, 6508 et 6628 
respectivement, 

D en positions 2172 et 2322 codes par les triplets GAT en 
positions 6514 et 6964, 

H en position 637 et 2321, codes respectivement par les 
triplets CAT en position 1909 et CAC en position 6961, 

Q en positions 1019 et 2694 codes respectivement par les 
triplets CAA (position 3055) et CAG (position 8080). 

Un procede de production d'une glycosyltransferase selon 
I'invention ayant les memes caracteristiques que ci-avant peut egalement 
comprendre : 

- une eiape de modification aleatoire de la sequence ID n° 4 
et d'etablissement d'une banque de variants, 

- une etape depression de ces sequences modifiees dans 
une cellule hote appropriee, un hote abritant un variant, 

- une etape de criblage des hotes exprimant une enzyme apte 
a former plus de 15 % et de preference plus de 30 % de liaison a(1 2) 
sur un substrat approprie, 

- une etape d'isolement du ou des genes ameliores. 

Dans un autre mode de realisation de I'invention, le procede 
consiste a modifier la sequence ID No. 3 par duplication de tout ou partie 
du domaine catalytique CD2. 

On pourra comprendre que les procedes ci-dessus visent non 
seulement a I'obtention d'une glycosyltransferase apte a former des 
oligosides presentant un taux de ramification a(1 -> 2) constant et 
reproductible, superieur a 15 % des ramifications totales mais egalement a 
ameliorer le taux de ramification ot(1 -» 2) dans Pobjectif de modifier les 
proprietes des oligosides obtenus dans le sens d'une amelioration de leurs 
proprietes dietetiques ou de leur capacite a maintenir ou retablir la flore 
bacterienne associee a certains organes du corps humain ou animal. 
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La presente invention porte enfin sur les glycosyltransferases 
susceptibles d'etre obtenues par un procede cite ci-avant et apte a former 
au moins 15 % et de preference au moins 30 % de ramifications de type 
ot(1 -> 2) osidiques dans des glucooligosaccharides. 
5 L'invention porte enfin sur Tutilisation des glycosyltransferases 

selon l'invention ainsi que celles susceptibles d'etre obtenues par les 
procedes ci-dessus, dans la fabrication d'une composition a effet 
prebiotique ou dans la fabrication d'une composition dermatologique, 
cosmetique ou pharmaceutique. 

10 A titre d'exemples non limitatifs, on peut citer I'amelioration du 

transit intestinal chez les animaux et chez Thomme, ('amelioration de 
I'assimiiation du calcium et/ou du magnesium et des mineraux en general, 
la prevention du cancer du colon, la prevention ou le traitement des 
affections de la peau telles I'acne, les pellicules, les odeurs corporelles. 

15 L'avantage des polypeptides et des acides nucleiques codant 

ces polypeptides selon Tinvention se situe non seulement au niveau de 
Tamelioration en terme de qualite, de rendement, de reproductible, et de 
prix de revient des glycosyltransferases aptes a former des 
oligosaccharides avec des ramifications de type a(1 -» 2) osidiques mais 

20 egalement dans la perspective de produire de nouvelles enzymes dont la 
fonctionnalite est amelioree. 

Les figures, exemples et description detailles ci-apres 
permettent, sans la limiter, d'illustrer les caracteristiques et les 
fonctionnalites particulieres des polypeptides a activite enzymatique et des 

25 sequences codant ceux-ci. Elles permettent en particulier d'illustrer de 

fa?on plus precise la specificite du domaine catalytique present dans la 
partie carboxylique de I'enzyme selon l'invention et son evolution potentielle 
pour I'obtention d'enzymes amefiorees. 

30 
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LEGENDE PES FIGURES : 

Figure 1 : structure des glycosyltransferases natives et des 
proteines recombinantes derivees : la figure 1a) represente la structure des 
glycosyltransferases et des dextrane-saccharases decrites dans la 
5 litterature (1). PS: peptide signal ; ZV : region variable, CD: domaine 
catalytique, GBD : domaine de liaison au glucane. La figure 1b) represente 
la structure de la giycosyltransferase selon Invention. Les figures 1c) a 1i) 
represented differentes constructions comportant des deletions en 
comparaison de la proteine DSR-E native. A(PS) correspond au controle 
10 constitue par la forme entiere donee dans le systeme pBAD-TOPO 
Thiofusion (Invitrogen). 

Figure 2 : schema recapitulatif de la methode de clonage de la 
sequence nucleotidique codant une giycosyltransferase selon I'invention a 
I'aide d'une bibliotheque genomique en utilisant une sonde PCR decrite 
15 dans le tableau I et une sonde H/ndlll/EcoRV respectivement. 

Figure 3 : comparaison des sequences signal de differentes 
glycosyltransferases de L mesenteroides. Les acides amines conserves 
sont en gras. DSR-B : L mesenteroides NRRL B-1299 (4); DSR-S : 
L mesenteroides NRRL B-512F (5) ; ASR: L mesenteroides NRRL B-1355 
20 (6). 

Figure 4 : alignement des 1 1 sequences repetees de Penzyme 
DSR-E et observees dans la zone variable. 

Figure 5 : alignement des sequences conservees du domaine 

catalytique. 

25 - Bloc A : acides amines essentiels de la partie N-terminale du 

domaine catalytique ; 

- Bloc B : acides amines de la partie du domaine catalytique 
de liaison au saccharose ; 

- Blocs C, D, E : blocs contenant les trois residus d'acides 
30 amines impliques dans la triade catalytique (6) ; 
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- Bloc F : sequence contenant la glutamine 937 de GTF-I 
etudiee par Monchois et a/. (7). 

Les acides amines entierement conserves sont indiques en 
gras. « * » : substitutions conservatives ; « : » : substitutions semi- 
conservatives ; — : GAP. Les numerotations sont celles de la sequence ID 
No. 2. 

Figure 6 : caracterisation HPLC des produits synthetises par 
I'enzyme recombinante DSR-E. 

6A : analyse en HPLC des glucooligosaccharides obtenus 
avec les dextrane-saccharases de L mesenteroides NRRL B-1299. 

6B : analyse HPLC des glucooligosaccharides obtenus par la 
DSR-E recombinante. ^identification des differents pics suivants : 

1 : fructose, 

2 : maltose, 

3 : sucrose, 

4 : panose, 

5 : R4, 

6 : OD4, 

7 : R5, 

8 : OD5, 

A, B, C : pics non identifies. 

6C : DSR-E recombinante deletee du domaine catalytique de 
la partie carboxylique de Tenzyme (A DSR-E). 

Figure 7 : analyse HPLC des produits de la reaction 
d'accepteur sur maltose, synthetises par les differentes formes entieres et 
deletees de la proteine DSR-E. 

L. m. B-1299 : melange de dextrane-saccharases produit par 
L. mesenteroides NRRL B-1299. 

L'identification des differents pics se fait comme suit : 

F : fructose 

M : maltose 
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S : saccharose 
P : panose 

R4, R5 : GOS comportant des liaisons a(1-»2) 
OD4, OD5 : GOS depourvus de liaisons ct(1->2). 
5 MATERIELS ET METHODES : 

1) Souches bacteriennes. plasmides et conditions de 

croissance : 

Toutes les souches sont conservees a -80°C dans des tubes 
contenant 15% de glycerol (v/v). 

10 Leuconostoc mesenteroides B-1299 (NRRL, Peoria, USA) est 

cultivee a 27°C, sous agitation (200 RPM) sur milieu standard (saccharose 
40 g.r\ phosphate potassium 20 g.r 1 , extrait de levure 20 g.r 1 , MgSQ 4 - 
7H 2 0 0.2 g.r 1 , MnS0 4 -H 2 0 0.01g.r 1 , NaCI 0.01g.l~ 1 , CaCI 2 0.02 g.r 1 , 
FeS0 4 -7H 2 0 0.01 g.r 1 ), le pH etant ajuste a 6,9. 

15 Escherichia coli DH5a et JM109 ont ete cultivees sur milieu LB 

(Luria-Bertani). 

La selection des clones recombinants de pUC18 ou pGEM-T Easy 
est effectuee sur boites LB-agar supplemente avec 100 Mg.ml' 1 
d'ampicilline, 0.5 mM d'isopropyl-p-D-thiogalactopyranoside (IPTG) et 40 

20 pg.mr 1 de 5-bromo-4-chloro-3-indolyl-(3-D-galactopyranoside (X-gal). Des 

cellules d' E. coli TOP 10 ont ete utilisees pour le systeme de clonage de 
produit PCR TOPO Cloning (Invitrogen), et cultivees sur milieu LB 
supplemente de kanamycine a la concentration de 50 pg.ml" 1 . 

En ce qui concerne Texpression de cferE, le kit de clonage ECHO 

25 Cloning System (Invitrogen) permet le clonage d'un produit PCR dans un 
vecteur donneur (pUNIA/5-His-TOPO), precedant une etape de 
recombinaison avec un vecteur accepteur adapte (pCR-T7-E). Ce systeme 
requiert des cellules E. coli PYR1, TOP 10 et BL21(DE3)pLysS cultivees 
sur milieu LB supplemente de 50 Mg.ml" 1 de kanamycine, ainsi que de 

30 34 pg.mr 1 de chloramphenicol pour la souche BL21(DE3)pLysS. 
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Les plasmides pUC18 digeres et dephosphoryles proviennent 
de Pharmacia (Amersham Pharmacia Biotech) et ont ete utilises pour la 
constitution de banque d'ADN genomique de L mesenteroides NRRL B- 
1299. Le clonage de produit PCR a, quant a lui, necessite I'emploi de 
5 plasmide pGEM-T Easy (Promega), et pour les fragments de plus de 2 kbp, 
de plasmide TOPO-XL (Invitrogen). 

Le systeme pBAD-TOPO Thiofusion (Invitrogen), utilise pour 
construire les differentes formes deletees de la proteine DSR-E, met en jeu 
le promoteur araBAD, dont les mecanismes de controle impliquent la 

10 proteine regulatrice AraC. En I'absence d'inducteur, a savoir le L-arabinose, 
la proteine dimerique AraC s'associe aux structures regulatrices de I'operon 
et entraine la formation d'une boucle d'ADN, ladite boucle bloquant ainsi la 
transcription des genes places sous le controle du promoteur araBAD. En 
presence de L-arabinose en revanche, AraC forme un complexe, ce qui 

15 libere la boucle d'ADN et permet I'initiation de la transcription, ^expression 

basale peut etre limitee en ajoutant du glucose au milieu de culture : celui- 
ci intervient en diminuant le niveau d'AMP cyclique, et done I'activation 
concomitante de la proteine CAP (cAMP activator protein). Le niveau 
d'activation obtenu est fonction de la concentration en L-arabinose, de telle 

20 sorte que les conditions optimales de production de la proteine d'interet 
peuvent etre selectionnees avec precision. 

De plus, Temploi de ce vecteur permet de positionner une 
etiquette thioredoxine de 12 kDa du cote N-terminal de la proteine d'interet. 
Cette fusion vise a favoriser la traduction du gene codant ladite proteine 

25 dMnteret. La proteine etiquette permet en outre d'augmenter la solubility de 

la proteine a laquelle elle se trouve fusionnee. Le systeme pBAD-TOPO 
Thiofusion est congu pour permettre d'eliminer facilement Tetiquette 
thioredoxine, par simple clivage a Taide de Tenterokinase. Enfin, grace a ce 
systeme d'expression, une etiquette histidine est inseree du cote de 

30 I'extremite C-terminale de la proteine d'interet. Une telle etiquette est utile 

pour purifier ladite proteine par affinite. 
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Dans le cadre de I'utilisation de ce systeme, la souche E. coli 
TOP 10 a ete cuitivee sur milieu LB supplements de 100 pg.mr 1 
d'ampicilline. 

2) Electrophorese sur gel, localisation et caracterisation de 

5 I'enzvme : 

Apres une culture de L mesenteroides NRRL B-1299 de 7h, 
le milieu a ete centrifuge (7000 RPM, 4°C, 30 min) et les cellules, ou 90% 
de I'activite enzymatique se retrouve, ont ete concentrees 10 fois dans une 
solution de tampon acetate (20 mM, pH 5,4), chauffees 5 minutes a 95°C 

10 en presence de solution de denaturation (Tris HCI 62.5 mM, SDS 4%, uree 
6M, bleu de bromophenol 0.01% et (3-mercaptoethanol 200 mM). 300 pi du 
melange a ete depose sur gel de polyacrylamide a 7%. Apres migration, les 
proteines totales ont ete revelees par coloration au noir amido, alors que 
I'activite dextrane-saccharase a ete detectee par coloration du polymere au 

15 reactif de Schiff apres synthese de dextrane in situ. Les bandes 
correspondent a des dextrane-saccha rases actives ont ete excisees et 
incubees separement dans 2 ml de solution d'acetate de sodium 20 mM pH 
5.4 contenant 100g.l" 1 de saccharose et 50 g.P 1 de maltose. Apres 
consommation totale du saccharose, la reaction a ete arretee par chauffage 

20 a 95°C pendant 5 minutes, et le milieu reactionnel centrifuge 5 minutes a 
15000g afin d'eliminer le dextrane insoluble. Les echantillons ont ete 
analyses par chromatographie en phase inverse ( colonne C18, Ultrasep 
100, 6 pm, 5x300mm, Bishoff Chromatography) en utilisant de I'eau 
ultrapure comme eluant, a un debit constant de 0.5 ml. min* 1 . Les 

25 oligosaccharides ont ete separes pendant 30 minutes a temperature 

ambiante, et detectes par refractometrie. Le sequengage peptidique a ete 
realise sur les bandes proteiques selectionnees par le Laboratoire de 
Microsequengage, Institut Pasteur, Paris. 

3) Techniques de bioloqie moleculaire utilisees : 

30 La purification du plasmide de E. coli et la purification de 

I'ADN genomique de L mesenteroides ont ete realisees en utilisation 
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respectivement QiaPrep Spin Plasmid kit et le Cell Culture DNA maxi kit 
(QiaGen). Les precedes d'amplification et de clonage ont ete realises en 
utilisant les techniques standard (Sambrook et Russel, 2001, supra). Les 
enzymes de restriction et de modification, provenant des societes 
5 commerciales New England Biolabs ou Gibco BRL, ont ete utilisees selon 

les protocoles des fabricants. 

La PCR a ete realisee avec des amorces choisies sur la base 
de la sequence proteique obtenue sur une bande de gel d'electrophorese 
isolee (voir supra, eiectrophorese sur gel et localisation de I'enzyme). Deux 
10 peptides ont ete selectionnes : 

- 29-FYFESGK, et 

- 24 -FESQNNNP 

et utilises pour synthetiser des oligonucleotides degeneres et indiques dans 

le tableau I ci-dessous. 
15 Dans ce tableau ou les numerotations sont celles de la 

sequence ID no. 4, il apparaTt que la presence d'un residu serine dans les 

deux peptides necessite la synthese de deux amorces pour chaque peptide 

dans la mesure ou la serine peut etre codee par six codons differents. 

ECHO-dir et ECHO-inv sont les amorces utilisees ayant permis 
20 Tamplification de dsrE par PCR pour son clonage dans le systeme 

depression ECHO Cloning (Invitrogen). 





TABLEAU I 




Designation 


Description 


Sequence 5'-3 v 


29-dir1 
29-dir2 


FYFESGK 


TT(CnOTA(C/T)TT(C^T)GA(A/G)rC4GG(C/G)AA(A/G) 
TT(CnOTA(C/T)TT(C/T)GA(A/G)/\GCGG(C/G)AA(A/G) 


24-inv1 
24-inv2 


FESQNNNP 


(T/G)G G (G/A)TT(G/A)TT(G/A)TTTTG TGA(T/C )TC AAA 
(T/G)GG(G/A)TT(G/A)TT(G/A)TTTTGGCT(T/C)TCAAA 


IPCR-rev 
IPCR-dir 


sequence nt 
5769-5798 

sequence nt 
8311-8342 


CCCTTTAC AAG CTGATTTTGCTTATCTG C G 
GGGTCAAATCCTTACTATACATTGTCACACGG 


ECHO-dir 


sequence nt -6 - 
39 

sequence nt 
8457-8504 


AGTTGTATGAGAGACATGAGGGTAATTTGTGACCGTAAAAAATTG 


ECHO-inv 


ATTTG AGGTAATGTTG ATTTATC AC CATCAAG CTTG AAATATTG AC C 
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PCR : 

La PCR a ete realisee en utilisant un thermocycleur Perkin- 
Elmer, modele 2400, et avec 50 nanogrammes d'ADN genomique. Les 
quantites d'amorces utilisees etaient de 10 mM de 29-Dir1 et de 24-lnv1 . Au 
5 melange reactionnel, ont ete ajoutes 250 pM de chaque desoxynucleotide 
triphosphate, et la Taq Polymerase. 

Apres une amplification de 25 cycles a 94° C pendant 
30 secondes puis a 50° C pendant 30 secondes, puis a 72° C pendant 
5 minutes, un fragment de 666 paires de base a ete obtenu. 

10 Certains fragments ont ete amplifies a I'aide du systeme 

« Expand Long Template PCR » (Roche Boehringer Mannheim), 
conformement aux indications d'utilisation du fournisseur. Ce systeme 
permet d'amplifier des fragments de grande taille, jusqu'a environ 20 kbp, 
de maniere tres efficace. La combinaison de deux ADN polymerases 

15 permet notamment de minimiser le taux d'erreur durant les etapes 
d'elongation. 

Hybridation southern et bibliotheque genomique de L. 
mesenteroides NRRL B-1299 : 

L'ADN chromosomique de L mesenteroides NRRL B-1299 a 
20 ete digere avec differentes enzymes de restriction, puis separe par 
electrophorese sur gel d'agarose d 0,8 % en tampon TAE 0,5X. 

Des bibliotheques genomiques de la bacterie ont ete 
transferees sur des membranes de nylon hybond N+ (Amersham 
PharmaciaBiotech). Uhybridation a ete r6alisee en utilisant le fragment de 
25 666 paires de bases a la desoxy-adenosine-triphosphate marque au 32 P. La 
reaction de marquage a ete realisee en utilisant le kit de marquage "Mega 
Prime DNA Labelling System Kit" (Amersham PharmaciaBiotech), suivie 
par la purification de la sonde sur des colonnes MicroSpin S-200HR. La 
pre-hybridation et Thybridation ont ete realisees en conditions fortement 
30 stringentes (65° C pendant la nuit, selon les methodes habituelles) 
(Sambrook et Russel, 2001, supra). 
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PCR inverse : 

La reaction de PCR inverse permet cTobtenir un fragment 
d'ADN lineaire a partir d'une matrice circulaire en utilisant des amorces 
divergentes. 

5 L'ADN genomique de L mesenteroides NRRL B-1299 a ete 

digere par EcoRV dans les conditions recommandees par le fournisseur. 

Apres re-circularisation, les produits de digestion ont ete 
utilises comme matrice dans une reaction de PCR inverse [Extrapol II DNA 
polymerase (Eurobio), volume reactionnel de 50 pi, parametres de la 
10 reaction de PCR inverse: 25 cycles; 94° C, 30 secondes ; 51° C, 
30 secondes ; 72° C, 3 minutes]. Les deux amorces ont ete choisies en 
fonction de la sequence de I'insert de pSB2 comme indique dans la 
figure 2. 

La figure 2 resume les modalites d'obtention des differents 
15 plasmides porteurs des fragments de dsrE par criblage de la bibliotheque 

genomique et utilisation des sondes decrites ci-dessus. 
Sequence d'ADN et analyse : 

Apres le sequen^age des peptides, des amorces degenerees 
dessinees en tenant compte de la frequence d'utilisation des codons dans 
20 les genes de dextrane-saccharases de L. mesenteroides NRRL B-1299, 
ont ete synthetisees et ont permis Tamplification d'un fragment de 666 bp. 
Le sequen$age de ce fragment a revele de fortes homologies avec les 
genes de dextrane-saccharases deja connus, tout en etant totalement 
nouveau. 

25 ^utilisation de ce fragment comme sonde homologue dans 

des experiences de Southern, a permis de reperer des signaux positifs sur 
differentes pistes d'ADN genomique digere. Une premiere banque H/ndlll a 
ainsi ete criblee, et un plasmide recombinant, nomme pSB2, contenant un 
insert de 5,6 kbp, a ete purifie. L'analyse de la sequence de ce fragment 

30 H/ndlll a revele un cadre ouvert de lecture couvrant la totalite de Tinsert. 

Ensuite, une banque EcoRV a ete criblee avec une sonde H/ndlll/EcoRV 
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isolee a I'extremite N-terminale de I'insert Hin6\\\ de 5,6 kbp. Un plasmide 
recombinant pSB3, teste positivement par dot-blot, s'est avere contenir un 
insert de 3,8 kbp qui, apres sequengage, a ete montre contenir le codon 
d'initiation de la traduction et la region promotrice du nouveau gene de 
5 dextrane-saccharase nomme dsrE. 

Dans le but d'obtenir le codon de terminaison de dsrE, une 
PCR inverse a ete realisee sur de I'ADN genomique de L mesenteroides 
NRRL B-1299 digere par EcoRV et religue sur lui-meme, en utilisant des 
amorces oligonucleotidiques divergentes dessinees a partir de la sequence 

10 de Tinsert pSB2. Un fragment unique a la taille attendue de 1 kbp a ete 
amplifie puis clone dans un pGEM-T Easy, pour obtenir le plasmide pSB4. 
Apres sequen^age, la sequence amplifiee situee en aval du site H/ndlll 
comporte 221 bp et contient le codon de terminaison du cadre de lecture de 
dsrE, situe 30 bp en aval du site de restriction Hind\\\. 

15 Le sequen?age des differents fragments portes par les trois 

plasmides a ete realise par la societe Genome Express et ce, sur les deux 
brins. Les analyses des sequences de nucleotides ont ete realisees en 
utilisant le "ORF Finder" ( http://www.ncbi.nlm.nih.gov/qorf/qorf.html) . Blast 
( http://www.ncbi.nlm.nih.gov/blast/blastcqi . Altschul et a/., 1997) ClustalW 

20 ( http://www2.ebi.ac.uk/clustalw . Thompson et a/., 1994), PRODOM 

( http://protein.toulouse.inra.fr/prodom.html Corpet et a/., 2000), PFAM 
( http://pfam.wustl.edu/hmmsearch.shtml , Bateman et a/., 2000) et SAPS 
( http://bioweb.pasteur.fr/seqanal/interfaces/saps.html . Brendel et a/., 1992), 
I'ensemble de ces logiciels etant accessible par internet. 

25 Expression de la proteine : 

Deux systemes de clonage et d'expression ont ete utilises aux 
fins de la production de proteines recombinantes chez E. coli, a savoir les 
systemes ECHO-Cloning et pBAD-TOPO Thiofusion (Invitrogen). 

A titre d'exemple, se trouve brievement d6crite ci-apres la 

30 methode de clonage de la sequence nucleotidique codant la proteine DSR- 

E au moyen du systeme ECHO-Cloning. 
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Deux amorces telles que proposees dans le tableau I ci- 
dessus ont ete utilisees dans ie cadre de ['amplification a I'aide du systeme 
"Expand Long Template" dans les conditions suivantes : 94° C pendant 3 
minutes suivis de 25 cycles a 94° C pendant 30 secondes, 55° C pendant 
5 30 secondes, et 68° C pendant 7 minutes. Les produits PCR ont ensuite 
ete clones dans le vecteur pUNIA/5-His-TOPO, permettant Tobtention d'un 
vecteur .donneur (pUNI-cferE) a recombiner avec un vecteur accepteur 
(pCR-T7-E) et adapte a I'expression dans E. coli. Le plasmide final a ete 
designe pCR-T7-dsrfE. 
10 Cette construction, pla9ant le gene dsrE sous le controle du 

promoteur du bacteriophage T7, a permis Texpression inductible du gene 
dsrE. 

Apres induction avec 1 mM d'IPTG, les cellules de E. coli 
BL21 transformees ont ete recoltees par centrifugation apres 4 heures de 
15 croissance, et re-suspendues a une densite optique finale de 80 a 600 nm 
dans du tampon acetate de sodium 20 mM pH 5,4 et du Triton X100 a 1% 
(v/v) en presence de 1 mM PMSF afin d'empecher la proteolyse dans les 
extraits cellulaires apres sonication. 

Des experiences similaires, realisee avec le systeme pBAD- 
20 TOPO Thiofusion, ont permis de construire le vecteur recombinant pBAD- 
TOPO-cterE. 

Tests enzymatiques : 

Les reactions enzymatiques ont ete r6alisees dans les 
conditions standard a 30 °C dans du tampon acetate de sodium 20 mM pH 

25 5,4, NaN 3 1 g/l" 1 et saccharose 100 g/l'\ L'activite de Tenzyme DSR-E a ete 
determinee en mesurant la Vitesse de liberation des sucres reducteurs, 
representes en Tespece par le fructose, a Taide de la methode a Tacide 
dinitro-salicylique bien connue de I'homme du metier. Une unite a ete 
definie comme la quantite d f enzyme qui catalysait la formation d'1 pmol de 

30 fructose par minute dans les conditions standard. Les oligosaccharides ont 
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ete synthetises dans un milieu reactionnel contenant 1 00 g/l de maltose, 
200 g/l de saccharose et 0,5 unites/ml de DSR-E. 

Comme pour la synthese de dextrane, la reaction 
enzymatique a ete poursuivie pendant 24 heures en presence de 100 g/l de 
5 glucose. Le dextrane produit a ete precipite en presence d'ethanol 50 % 
(v/v) et lave deux fois dans I'ethanol a 50 % (v/v) avant lyophilisation. II a 
ensuite ete dissous d 10 mg/ml dans du D 2 0 et analyse par spectrometrie 
deRMrl du 13 C. 

Separation par HPLC : 
10 Des echantillons de 100 \s\ ont ete preleves et chauffes a 

95 °C pendant 5 minutes, puis dilues dans de I'eau ultra-pure de maniere a 
obtenir une concentration finale en sucres totaux inferieure a 5g.l~ 1 . Apres 
centrifugation, les substrats residuels et les differentes especes formees 
ont ete analyses par HPLC sur colonne C18 (Ultrasep 100, 6 |jm, 
15 5x300 mm, Bishoff Chromatography). 

La separation des oligosides a ete realisee a temperature 
ambiante, pendant 30 minutes, dans de Teau ultra-pure appliquee a titre 
d'eluant a un debit de 0,5 ml/min. La detection a ete accomplie par 
refractometrie. 

20 De telles conditions ont permis de separer les especes 

suivantes : fructose, maltose, leucrose, saccharose, ainsi que les oligosides 
dont le degre de polymerisation ne depassait pas 6. 
Calcul des rendements : 

La methode de calcul des rendements des reactions de 
25 synthese d'oligosides a pris en compte la concentration residuelle 
d'accepteur, conformement a la formule suivante : 

R = {[GOS finaux] - [GOS initiaux]} / {0,474 x [saccharose consomme] + 
[accepteur consomme]} 

ou R represente le rendement reel de la reaction de synthese des GOS 
30 totaux, les concentrations etant exprim6es en g/L 
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Construction des d iff e rentes formes deletees de la 
proteine DSR-E : 

Les differentes formes deletees de la proteine DSR-E [Figure 
1c) a 1i)] ont ete obtenues par amplification par PCR des fragments 

5 correspondants du gene dsrE, puis clonage dans le vecteur pBAD-TOPO 

Thiofusion, dont la description est fournie supra. Les amorces utilisees pour 
Tamplifioation des regions selectionnees a partir du gene dsrE sont listees 
dans le tableau II suivant. Les positions des amorces sont indiquees en 
reference a la sequence ID no. 5, relative 3 la sequence du gene dsrE. Les 

10 bases mutees afin d'introduire le site de restriction Nco\ sont en caracteres 
gras et le site A/col resultant est souligne. 

TABLEAU II : 



Designation 


Positions 


Sequence 5'-3' 


pBAD-PS/ZV-dir 


344-373 


GCCATGGCAAATACGATTGCAGTTGACACG 


pBAD-ZV/CD1-dir 


971-1001 


GCCATGGACGGTAAAACCTATTTTCTTGACG 


pBAD-CD1/GBD-dir 


3656-3682 


TCCATGGGTGAAAAAACAAGCACCGGC 


pBAD-GBD/CD2-dir 


6167-6189 


ACCATGGATATGTCTACTAATGC 


pBAD-CD1/GBD-inv 


3638-3658 


TAACTGI I I AGGCAAGAATCC 


pBAD-GBD/CD2-inv 


6146-6172 


TAATGTATTAGTGAATAAGTATTCACC 


pBAD-ent-inv 


8714-8737 


AATTTGAGGTAATGTTGATTTATC 



15 

Les amorces directes et inverses ci-dessus ont ete dessinees 
de maniere a assurer la fusion traductionnelle de Tetiquette thioredoxine en 
N-terminal et I'etiquette polyhistidine en C-terminal des formes proteiques 
tronquees en respectant les cadres ouverts de lecture des regions codant 
20 lesdites formes. 

Dans la mesure ou le plasmide pBAD-TOPO Thiofusion 
contient un site de restriction specifique de I'enzyme Nco\ situe au niveau 
de Textr6mite 5' de la region codant la thioredoxine, un deuxieme site Nco\ 
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a ete introduit dans chaque amorce directe afin de pouvoir, le cas echeant, 
extra ire ladite region. 

Les reactions d'amplification par PCR ont ete realisees a 
I'aide du systeme « Expand Long Template » dans les conditions 
5 suivantes : une pre-denatu ration a 94 °C pendant 3 minutes, suivie de 25 

cycles a 94 °C pendant 30 secondes, 52 °C pendant 30 secondes et 68 °C 
pendants minutes. 

Les produits d'amplification ainsi generes ont ensuite ete 
clones dans le vecteur pBAD-TOPO Thiofusion aux fins de la 
10 transformation subsequente de la souche E. coli TOP 10. Des clones 
recombinants ont ete selectionnes, leur profil de restriction analyse afin 
d'identifier, pour chacune des formes recherchees, un plasmide 
recombinant portant I'insertion orientee comme attendu. 

Exemple 1 : Caracterisation et purification de I'enzyme 
1 5 DSR-E et obtention du gene dsrE 

Les enzymes produites par les cultures de L mesenteroides 
et obtenues sur gel de polyacrylamide en SDS tel que decrit dans la partie 
Materiels et Methodes ont ete isolees par decoupe du gel. 

Les GOS produits par les enzymes ainsi isolees ont ete 
20 analyses par HPLC selon les methodes decrites dans (1). Uenzyme dont 
Tactivite etait recherchee a ete deduite de la nature des GOS produits. 
Apres proteolyse trypsique et separation par HPLC des peptides produits, 2 
peptides : 29- FYFESGK et 24- FESQNNNP ont ete sequences et utilises 
comme modele pour la synthese d'amorces nucleotidiques degenerees. 
25 Les differentes etapes d'amplification et de clonage sont 

representees dans la figure 2. Le gene complet a ete insere dans le 
plasmide pCR-T7-E et exprime dans E. coli. 

La production d f une enzyme fonctionnelle est attestee par la 
production des GOS dont Tanalyse HPLC est representee dans la 
30 figure 6b). 



WO 02/074943 




PCT7FR02/00951 



34 

On remarquera en particulier I'importance des pics 5 et 7 
representatifs des GOS a ramification a(1->2). 

Exemple 2 : caracterisation des sequences de dsrE et 

DSR-E 

5 2.1 Sequence nucleotidique : 

La sequence nucleotidique de I'enzyme est representee dans 
la sequence ID No. 4. Elle est composee d'un cadre de lecture de 
8506 nucleotides. 

La sequence nucleotidique de I'insert dans le plasmide pCR- 
10 T7-dsrE contient un site de liaison au ribosome (RBS), 9 bases en amont 
du codon d'initiation ATG et est composee d'un hexa-nucleotide GAGGAA. 
2.2 Analyse de la sequence d'amino-acides : 
La sequence de 8506 nucleotides de dsrE code une proteine 
de 2835 acides amines representee dans la sequence ID No. 2. Le point 
1 5 isolectrique de cette proteine est de 4,88 et son poids moleculaire theorique 
de 313,2 kDa. En depit des fortes similarites avec les dextrane- 
saccharases deja connues, DSR-E est caracterisee par une structure 
originale. 

L'alignement de la sequence d'amino-acides avec I'ensemble 
20 des glycosyltransferases et des dextrane-saccharases connues confirme 
que la structure en domaine des glycosyltransferases et des dextrane- 
saccharases est conservee, a savoir : une sequence signal, une region 
variable, un domaine catalytique hautement conserve et un domaine de 
liaison au glucane. Cette structure est representee dans la figure 1a). 
25 Comme Tindique la figure 1b), un deuxieme domaine 

catalytique forme la partie carboxy-terminale de Tenzyme comme cela ete 
confirme par PRODOM et une analyse Blast. 

Avec un poids moleculaire de 313,2 kDa, DSR-E a environ 
2 fois le poids moleculaire moyen des autres glycosyltransferases et 
30 dextrane-saccharases (1), ce qui est en accord avec la presence d f un 
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deuxieme domaine catalytique a I'extremite C-terminale et egalement avec 
un domaine de liaison au glucane plus long. 

a) analyse de la sequence signal : 

La sequence signal et la sequence nucleotidique codant le 
5 peptide signal sont extremernent conservees si on les compare aux autres 
dextrane-saccharases comme ceci est indique dans la figure 3. Le site de 
clivage est localise entre les acides amines 40 et 41 . 

b) domaine variable : 

En aval du peptide signal, DSR-E a un domaine variable de 
10 207 acides amines. Lorsqu'on le compare aux autres domaines variables 
des glycosyltransferases, en utilisant un programme d'alignement de type 
SAPS, on met en evidence la presence d'un motif de 14 acides amines 
repete 1 1 fois comme ceci est indique dans la figure 4. 

Ce motif repete, riche en alanine, threonine et acide 
15 aspartique n'a jamais ete identifie precedemment. 

Le role et la signification de cette region n'ont jamais ete 
elucides. Differentes etudes ont demontre que sa deletion n'affecte pas 
I'activite enzymatique (4). Le role du motif repete de 14 acides amines qui 
n'existe pas dans les autres glycosyltransferases reste neanmoins a 
20 determiner. 

c) analyse des domaines catalvtiques : 

Le premier domaine catalytique s'etend des acides amines 
248 a 1142 (CD1) de la sequence ID No. 2, alors que le deuxieme est 
localise entre les acides amines 1980 et 2836 (CD2). Ces deux domaines 
25 presentent 45 % d'identite et 65 % de similarity entre eux. 

CD1 et CD2 contiennent les acides amines d6ja identifies 
dans les glycosyltransferases et les dextrane-saccharases comme etant 
essentiels a leur activite enzymatique, et comme ceci est indique dans la 
figure 5. 

30 Les triades catalytiques de CD1 et CD2 determines par 

analogie avec Vol amylase (7) sont presentes aux positions suivantes : 
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(Asp 527/Glu 565/Asp 638 pour CD1 et Asp 2210/Glu 2248/Asp 2322 pour 
CD2). 

D'autres residus conserves ont ete identifies comme 
importants pour I'activite enzymatique : les residus Trp 425/Glu 430 pour 
5 CD1 et Trp 2122/Glu 2127 pour CD2, lesquels sont analogues a celles du 

domaine N-terminal de GFTI decrits par Monchois et al. (4) : Trp 344/Glu 
349. 

En revanche, certaines sequences situees dans la region 
conservee des glycosyltransferases et des dextrane-saccharases ne se 
10 retrouvent pas dans CD2 de DSR-E. Ainsi, comme indique dans la figure 5 
ci-dessous, les sequences FIHNDTI (2214-2220) et KGVQEKV (2323- 
2329) divergent des autres sequences consensus des dextrane- 
saccharases deja etudiees qui sont respectivement NVDADLL et 
SEVQTVI. 

1 5 d) domaine de liaison au glucane : 

Lorsque Ton compare la sequence de DSR-E avec les 
sequences connues, il apparait que le domaine de liaison au glucane est 
sensiblement plus long. En effet, ce domaine a une longueur d'environ 
500 acides amines dans les glycosyltransferases et les dextrane- 

20 saccharases etudiees alors que dans DSR-E, il represente 836 acides 
amines. Plusieurs motifs repetes A et C et, en particulier, une serie de 
repetitions AC ont pu etre identifies. Dans le Tableau III suivant, sont 
indiquees les sequences consensus des motifs repetes du GBD, 
notamment des motifs A et C, decrits dans la litterature relativement a des 

25 dextrane-saccharases de Leuconostoc et Streptococcus spp. 
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TABLEAU III : 

Motif Sequence consensus 

"A WWYFNxDGQAATGLQTIDGQTVFDDNGxQVKG 

B VNGKTYYFGSDGTAQTQANPKGQTFKDGSGVLRFYNLEGQYVSGSGWY 
C DGKIYFFDPDSGEWKNRFV 
D 9 GG WKNADGTYSKY 

N YYFxAxQGxxxL 
x : acide amine indifferent. 

5 Exempte 3 : expression de cfsrE chez E. coli 

Des cellules de E. coli BL21 (DE3) pLysS pCR-T7-cferE ont 
ete cultivees comme decrit ci-dessus. Apres gel d'electrophorese en 
polyacrylamide-(page-SDS) Panalyse des extraits proteiques a revele 
effectivement la presence de plusieurs bandes ayant Pactivite de dextrane 
10 saccharase, ladite activite etant mesuree comme ci-dessus. 

La lignee E. coli JM109 [pCR-T7-ctoO] a ete deposee a la 
CNCM le 15 mars 2001 sous le numero I-2649. 

Identification et caracterisation de Pactivite enzymatique : 

En utilisant une molecule accepteur de glucose, les dextrane- 
15 saccharases produites par E. coli recombinant ont ete comparees avec 

celles produites par L. mesenteroides NRRL B-1299. 

Uanalyse HPLC des produits de la reaction avec la DSR-E 
recombinante montre (figure 6) des temps de retention correspondant aux 
GOS prealablement identifies R4 et R5 (2). Les oligosaccharides de type R 
20 sont les series de GOS lineaires, le lien a(1-»2) etant lie a Pextremite non- 
reductrice. La serie OD, GOS lineaires resultant de liens glycosidiques 
a(1->6) avec un residu maltose a Pextremite reductrice, a ete observee en 
tres faibles quantites. Trois nouveaux composes sont en revanche detectes 
dans les produits de Penzyme recombinante. 
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Identification des GOS produits : 

Finalement, ia figure 6b montre clairement que les pics 5 et 7 
representant les GOS de la serie R sont relativement plus importants avec 
Tenzyme recombinante qu'avec 1'enzyme native dont les pics 
5 correspondant au panose et a OD5 sont plus importants. 

Exemple 4 : Effet de la deletion de CD2 sur I'activite 
enzymatique de DSR-E 

L'ADN genomique de L mesenteroides NRRL B-1299 a ete 
utilise comme matrice pour amplifier par PCR le gene dsrE. delete de la 
10 sequence correspondant au second domaine catalytique. Pour cela, 
2 oligonucleotides, ECHO-dir 

(5'-AGTTGTATGAGAGACATGAGGGTAATTTGTGACCGTAAAAAATTG) 
(SEQ. ID No. 6), correspondant a la sequence nucleotidique -6 a 39 et 
contenant le codon d'initiation de la traduction, et ECHO-inv-del (5- 

1 5 GTATTAGTGAATAAGTATTCACCATTGCATTTATCGTCAAAATAGTACG) 
(SEQ. ID No. 7) complementaire de la sequence 5889-5937 et 
correspondant a la sequence peptidique YYFDDKGNGEYCFTNT, ont ete 
synthetises, afin de fusionner Textremite C-terminale de la proteine deletee 
avec un tag His present sur le vecteur de clonage. La reaction PCR a ete 

20 realisee grace a un DNA thermal cycler model 2400 (Perkin-Elmer), avec le 
systeme Expand Long Template System (Boehringer Mannheim), suivant le 
cycle de temperature : 94°C pendant 3 min, puis 25 cycles avec : 30 s a 
94°C, 30s a 55°C et 7 min a 68°C. Le produit PCR a ensuite ete clone dans 
le vecteur donneur pUNI, et le plasmide resultant, utilise dans une reaction 

25 de recombinaison avec le vecteur d'expression pCR-T7-AcferE. 

La preparation des extraits cellulaires, les reactions 
enzymatiques, ('analyse des produits de la reaction sont les memes que 
dans I'exemple 3 ci-dessus. 

Le profil HPLC des GOS obtenus avec I'enzyme DSR-E 

30 deletee du domaine CD2 apparait dans la figure 6 c). 
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Les GOS de type R t representes par les pics 5 et 7 visibles 
dans la figure 6 a) et 6 b) sont totalement absents des produits obtenus 
avec I'enzyme recombinante deletee de CD2. Les seuls produits 
analysables sont ceux correspondant a des oligosides lineaires resultant de 

5 liens a(1 -> 6) avec un residu maltose dans la partie reductrice. Ce resultat 

indique clairement le role essentiel du domaine catalytique situe dans la 
partie carboxy-terminale de I'enzyme dans sa capacite a former des 
liaisons osidiques a(1 -> 2). 

Exemple 5 : etude des relations structure-fonction de la 

10 proteine DSR-E 

Le gene dsrE, en ce qu'il est le premier gene codant une 
dextrane-saccharase catalysant la synthese de liaisons a(1->2) a avoir ete 
clone, revet un interet particulier. II est done important de caracteriser ce 
gene ainsi que son produit d'expression, en Poccurrence en determinant 

15 quelle est I'implication des differents domaines composant la proteine DSR- 
E dans la fonction qui lui a ete assignee, a savoir de correspondre a une 
dextrane-saccharase specifique de la synthese de liaisons <x(1->2). 
5.1 Formes deletees de la proteine DSR-E : 
Uetude de six formes differentes obtenues par deletion d'un 

20 ou de plusieurs domaines de la proteine DSR-E a ete envisagee afin de 
determiner, en reference a la Figure 1 ci-dessous : (i) Tinfluence de la 
presence du domaine CD2 en etudiant les constructions GBD-CD2 et 
A(CD2) ; (ii) I'influence de la presence de la zone variable en analysant les 
formes A(ZV) et CD1-GBD ; et (iii) le potentiel catalytique intrinseque des 

25 domaines CD1 et CD2 exprimes de fa9on isolee (constructions CD1 et 

CD2). 

Uactivite catalytique de chacune des differentes formes a ete 
comparee a celle observee avec le controle correspondant a la forme 
entiere deletee du seul peptide signal A(PS) [Figure 1c)]. 

30 
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5.2 Analyse des constructions : 

A Tissue de la procedure experimental d'amplification par 
PGR et de clonage detaillee supra, plusieurs clones presentant une 
insertion selon I'orientation escomptee ont ete obtenus pour chacune des 
5 constructions envisagees, a Texception de la forme tronquee GBD-CD2 

pour laquelle le produit d'amplification souhaite n'a pu etre clone. 

Les sequences des insertions ont ete determinees afin de 
s'assurer de Tabsence de mutations susceptibles de modifier, apres 
traduction, des acides amines situes au niveau de positions presumees 
10 essentielles pour I'activite enzymatique de la proteine ainsi codee. 

Une mutation a ete identifiee au niveau de la 31* me base de 
insertion relative au controle A(PS), induisant la substitution d'un acide 
aspartique par une asparagine en position 10 de la zone variable. N'etant 
pas situee au niveau des motifs repetes S de la zone variable (Figure 4), il 
15 semblerait que I'incidence de cette mutation sur la fonction finalement 
observee soit negligeable. 

Une mutation a ete introduite dans le produit d'amplification 
correspondant a la construction A(CD2), modifiant le residu aromatique 
F1411 en leucine. Cette mutation est situee dans le premier tiers du 
20 domaine de liaison au glucane GBD, au niveau d'une jonction entre deux 
motifs repetes. 

La construction A(ZV), eu egard aux erreurs effectuees par la 
polymerase lors de la reaction d'amplification par PCR, ne presentait pas la 
sequence attendue. En effet, insertion contenait un cadre ouvert de 

25 lecture, ledit cadre correspondant pour Tessentiel a la forme GBD-CD2 qui 

n'avait pu etre donee. Cependant, dans la forme GBD-CD2 obtenue en 
definitive a la place de A(ZV), les 46 residus N-terminaux etaient absents. 
Or, le domaine GBD compte plus de 800 acides amines formant un 
enchaTnement de 24 unites repetees. Get enchamement est tel que, sur les 

30 46 residus tronques, seuls les 9 derniers etaient situes au niveau de Tune 
desdites unites, et en particulier au niveau de la premiere d'entre elles. II 
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paraissait en consequence plausible de considerer que la deletion de ces 
acides amines etait sans influence sur la reaction enzymatique catalysee 
par la forme proteique correspondante. Cette hypothese etait d'autant plus 
vraisemblable qu'il a ete montre sur d'autres dextrane-saccharases, que la 
5 perte d'un certain nombre d'unites repetees du domaine GBD ne reduisait 

pas I'activite de la proteine resultante de maniere significative (8). 

L'insertion codant la forme CD1-GBD contenait une mutation 
affectant le residu F633, situe dans le domaine CD1, et plus precisement, 
au niveau d'une region fortement conservee parmi les dextrane- 

10 saccharases, elle-meme localisee juste avant le deuxieme acide aspartique 
de la triade catalytique (Figure 5). La phenylalanine attendue etait 
substitute par une leucine. II est difficile, a ce stade, d'estimer rimpact 
d'une telle mutation sur I'activite catalytique observee. 

De la meme maniere que pour les autres constructions, la 

15 sequence des insertions codant les domaines catalytiques CD1 et CD2 
isoles est determinee. 

5.3 Produits depression et activites enzvmatiques : 
Les proteines correspondant aux diverses formes deletees de 
DSR-E ont ete exprimees en soumettant les cellules recombinantes de E. 

20 coli a une induction par le L-arabinose selon une concentration de 0,002 %. 

L'activite enzymatique a ete observee pendant les quatre premieres heures 
qui suivaient I'induction. 

Les extraits proteiques obtenus par sonication des culots 
cellulaires ont ete analyses en electrophorese SDS-PAGE (Sambrook et 

25 Russel, 2001, supra). Les masses moleculaires des proteines 
recombinantes ont ete estimees a partir des profits elect rophoretiques 
obtenus, lesdites masses correspondant pour Tessentiel aux masses 
attendues, en tenant compte de Tincrementation de 12 kDa liee a Tetiquette 
thioredoxine. Le Tableau IV ci-apres resume les valeurs estimees des 

30 masses moleculaires des differentes formes tronquees et fournit, a titre de 
comparaison, les masses attendues. 
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TABLEAU IV : 



Forme proteique 


Masse attendue 
(kua) 


Masse attendue + 
inioreuoxine \KUci) 


Masse estimee 


A(PS) 


309 


321 


324 


A(CD2) 


218 


230 


ND 


GBD-CD2 


224 


/ 


233 


CD1-GBD 


193 


205 


199 


CD1 


99 


111 


111 


CD2 


95 


107 


ND 



ND : non determine. 



Dans le Tableau V suivant, sont indiquees la nature et la 
position des acides amines marquant le debut et la fin des formes 
proteiques construites dans le cadre de cette etude. Les differentes 
positions font reference a la sequence ID no! 2 correspondant a la proteine 
DSR-E. 

TABLEAU V : 



Forme proteique Acide amine de Acide amine de fin Longueur totale 

debut __ 



A(PS) 


N41 


I2835 


2795 


A(CD2) 


M1 


L1980 


1980 


GBD-CD2 


M1188 


I2835 


1648 


CD1-GBD 


I248 


L1980 


1733 


CD1 


I248 


Q1141 


894 


CD2 


D1981 


I2835 


855 



La forme GBD-CD2 ne possedait pas I'etiquette thioredoxine. 
En effet, cette forme etait issue des aleas experimentaux occasionnes par 
1 5 la procedure d'amplification par PCR de la sequence censee coder la forme 
A(ZV). Eu egard aux deletions de sequences alors generees, Tetiquette 
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thioredoxine, en principe situee en 5' de la proteine d'interet, n'avait pu etre 
fusionnee avec la region GBD-CD2. 

La qualite des gels d'electrophorese n'a pas permis de 
determiner si le niveau d'expression des differentes formes etait 
5 quantitativement identique et, en consequence, si lesdites formes etaient 

presentes dans les memes proportions dans les extraits cellulaires. 

Aussi les mesures d'activite fournies ont ete etablies sur la 
base d'un volume donne d'extraits cellulaires, mais n'ont pu etre ramenees 
a la quantite de chaque proteine reellement contenue dans ledit volume 
10 d'extraits. 

La synthese de polymeres de dextrane in situ par incubation 
des g e | S cTelectrophorese dans une solution de saccharose, et la coloration 
au reactif de Schiff subsequente ont confirme la presence de proteines 
possedant une activite glucane-saccharase dans les extraits cellulaires 

15 correspondant a A(PS), A(CD2), GBD-CD2 et CD1-GBD. 

Dans le Tableau VI ci-dessous, sont presentees les activites 
enzymatiques maximales observees pour chaque construction. Les 
resultats ont confirme les donnees tirees des experiences de coloration des 
gels au reactif de Schiff, a savoir le fait que les extraits cellulaires relatifs 

20 aux formes A(PS), A(CD2), GBD-CD2 et CD1-GBD presentaient une 
activite saccharase, a I'inverse des deux domaines catalytiques pris 
isolement. Ce resultat etait conforme a la litterature, etant donne qu'il avait 
ete montre pour d'autres dextrane-saccharases, que Tabsence du domaine 
GBD induisait une perte d'activite enzymatique drastique (8, 9, 10). 

25 

TABLEAU VI : 



Forme 
proteique 


A(PS) 


A(CD2) 


GBD-CD2 


CD1-GBD 


CD1 


CD2 


Activite 

maximale 

(U/l) 


1063 


181 


86 


235 


5.3 


0 
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La forme CD1 possedait une activite intrinseque de niveau 
suffisant pour etre detectee. Quant a la forme GBD-CD2, elle presentait un 
niveau d'activite ncn negligeable, dont on pouvait conclure que 
Torganisation structural correspondante, a savoir un domaine catalytique 
5 en aval du domaine de liaison au glucane, demeurait enzymatiquement 

active. 

5.4 Effets des deletions sur la synthese d'oliqosides : 
Dans la mesure ou la specificite de synthese des liaisons 
10 <x(1->2) est conservee lors de la reaction en presence d'un accepteur, des 
experiences de synthese d'oligosides a partir de maltose ont d'abord ete 
effectuees (Figure 7). 

Lorsque les reactions ont ete menees a leur terme, c'est-a- 
dire lorsque tout le saccharose a ete consomme, les rendements de 
15 synthese en oligosides ont ete calcules. Les resultats apparaissent dans le 
Tableau VII suivant. Seule la reaction impliquant I'extrait cellulaire 
contenant la forme proteique CD1 n'a pu permettre un tel calcul. L'effet de 
la temperature a probablement conduit a Tinactivation de la tres faible 
activite presente dans Textrait proteique. 

20 

TABLEAU VII : 



Forme proteique 


Rendement en 
oligosides de la serie 
OD (%) 


Rendement en 
oligosides de la serie 
R (%) 


Rendement en 
oligosides totaux 


Enzyme native 


36 


28 


64 


A(PS) 


41 


14 


55 


ACD2) 


67 


1 


68 


GBD-CD2 


45 


47 


92 


CD1-GBD 


100 


0 


100 
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Comms indique sur la Figure 7 ci-dessous, la presence 
d'oligosides de la serie R n'etait decelee qu'avec les formes enzymatiques 
possedant le domaine catalytique CD2, a I'exception du cas ou ledit 
domaine etait isole et alors rendu completement inactif. En effet, les temps 
5 de retention des oligosides synthetises par la forme deletee du deuxieme 
domaine catalytique, ainsi que par la forme CD1-GBD, correspondaient 
uniquement a ceux de la serie OD, c'est a dire aux GOS depourvus de 
liaisons a(1->2). Ces resultats indiquaient done que le domaine CD2 etait 
requis pour la formation des liaisons <x(1 ->2). 

10 Les produits obtenus avec la forme GBD-CD2 ont permis 

d'etayer ces observations. Cette construction, qui possedait CD2 comme 
seul domaine catalytique, etait capable de catalyser de maniere 
preponderante la synthese d'oligosides de la serie R f possedant des 
liaisons a(1->2). Ce resultat demontrait done que la specificite en terme de 

15 fonction de I'enzyme DSR-E reside dans la sequence tres originate de ce 
domaine, et non pas dans Tassociation de deux domaines catalytiques. En 
outre, la forme proteique GBD-CD2 permettait egalement la synthese de 
liaisons a(1->6). Toutefois, les faibles rendements obtenus pour ces 
oligosides indiquaient qu'ils etaient preferentiellement convertis en 

20 oligosides de degre de polymerisation superieur appartenant a la serie R, 
ce qui empechait leur accumulation dans le milieu reactionnel, a la 
difference des molecules de la serie R qui, elles, n'etaient pas converges 
(2). 

En comparant les profils des produits obtenus, tels que 
25 montres a la Figure 7, il est apparu que la forme entiere A(PS) synthetisait 
majoritairement des oligosides lineaires. En effet, la molecule R4 etait 
absente et Toligoside R5 faiblement present Le domaine catalytique CD1 
permettait, quant a lui, de catalyser la synthese exclusive de liaisons 
a(1->6) et son activite semblait preponderante par rapport a celle du 
30 domaine CD2. Aussi, dans la forme entiere de Tenzyme, ('implication du 
domaine CD2 serait done moins importante du fait de : (i) parametres 
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catalytiques intrinseques plus faibles ; et/ou (ii) d'une configuration globale 
de I'enzyme defavorable a son activite. 

En outre, I'enzyme entiere A(PS) catalysait la synthese 
d'oligosides de la serie R avec un rendement inferieur a celui observe avec 
5 le melange de dextrane-saccharases produit par L mesenteroides NRRL 

B-1299 (Figure 7). Le rendement obtenu, de 28 %, etait situe entre ceux 
observes avec la forme entiere A(PS) d'une part, et la forme GBD-CD2 
d'autre part. Or, Ton sait que la souche sauvage produit plusieurs formes 
de dextrane-saccharases susceptibles de synthetiser des liaisons 

10 osidiques, et notamment des liaisons a(1^2). Une hypothese avait ete 
emise, selon laquelle lesdites formes etaient des produits de degradation 
de DSR-E. Ainsi, dans la mesure ou des formes tronquees de DSR-E, 
telles GBD-CD2, pouvaient catalyser la synthese d'oligosides de la serie R 
plus efficacement, il semblerait que les rendements obtenus avec le 

15 melange heterogene produit par L mesenteroides NRRL B-1299 soient 

imputables a la contribution des activites catalytiques de Tensemble de ces 
differentes formes enzymatiques. 

En conclusion, les inventeurs ont reussi, en isolant une dextrane 
saccharase particuliere produite par L mesenteroides, & caracteriser une 

20 structure particuliere et inattendue de cette enzyme apte a produire des 
oligosides d'interet et presentant des ramifications de type ot(1->2). 
Uidentification et la caracterisation de cette sequence permettent d ! une part 
de construire des cellules ou organismes recombinants exprimant de fa?on 
specifique cette enzyme et, d'autre part, d'en envisager sa modification par 

25 mutagenese dirigee ou aleatoire ou par evolution moleculaire (DNA 
Shuffling) afin d'en ameliorer encore ses caracteristiques. 

Cette invention permet en outre d^meliorer le rendement et la 
reproductibilite de la production des GOS d'interet pour les differentes 
applications citees ci-avant. 

30 
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RE VEN DIC ATIONS 

1. Polypeptide isole ayant une activite enzymatique de 
5 glycosyltransferase apte a former des dextranes presentant des 

ramifications a(1 2) a partir de saccharose, d'cc-D-fluoro-glucose, de 
para-nitrophenyl-ot-D-glucopyranoside, d'a-D-glucopyranoside-aD- 
sorbofurano-side ou de 4-O-aD-galactopyranosylsucrose, caracterise en ce 
qu'il comprend au moins un domaine de liaison au glucane et un domaine a 
10 activite catalytique silue en aval du domaine de liaison au glucane. 

2. Polypeptide selon la revendication 1 comprenant au moins 
deux domaines catalytiques situes de part et d'autre du domaine de liaison 
au glucane. 

15 

3. Polypeptide selon la revendication 1 ou 2 comprenant un 
peptide signal, une region variable, deux domaines catalytiques et un 
domaine de liaison au glucane situe entre les deux domaines catalytiques. 

20 4. Polypeptide selon Tune des revendications 1 a 3 dans 

lequel le ou les domaine(s) a activite catalytique a (ont) un pourcentage de 
similarity compris entre 65 % et 100 % avec la SEQ. ID n°1. 

5. Polypeptide selon Tune des revendications precedentes 
25 dans lequel la taille du domaine de liaison au glucane est superieure a 

500 aminoacides. 

6. Polypeptide selon la revendication 5 ayant la SEQ. ID n°2. 

30 7. Polypeptide selon la revendication 6 modifte par 

substitution, insertion, deletion de sequences d'acides amines et 
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comportant des sequences presentant au moins 80 % et de preference au 
moins 90 % de similarite avec les sequences suivantes de la sequence ID 

n° 2 : 

423 - 439 (SEQ. ID n° 6) 2120 - 2138 (SEQ. ID n° 12) 

478-501 (SEQ. ID n° 7) 2161 -2184 (SEQ. ID n° 13) 

519 - 539 (SEQ. ID n° 8) 2202 - 2214 (SEQ. ID n° 14) 

560 - 571 (SEQ. ID n° 9) 2243 - 2250 (SEQ. ID n° 1 5) 

631 -645 (SEQ. ID n° 10) 2315-2322 (SEQ. ID n° 16) 

1014-1021 (SEQ IDn° 11) 2689 - 2696 (SEQ. ID n° 17) 



8. Polypeptide selon la revendication 7 dans lequel les acides 
amines suivants sont inchanges : 

W en positions 425 et 2122, 
E en positions 430, 565 et 2127, 2248, 
5 D en positions 487, 489, 527, 638, 2170, 2172, 2210 et 

2322, 

H en position 637 et 2321 , 
Q en position 1019 et 2694. 

9. Acide nucleique isole codant une enzyme a activite 
glycosyltransferase apte a former des dextranes presentant des 
ramifications a(1 -> 2) a partir de saccharose, d'ct-D-fluoro-glucose, de 
para-nitrophenyl-a-D-glucopyranoside, d'a-D-glucopyranoside-aD- 
sorbofura no-side ou de 4-O-a-D-galactopyranosylsucrose, et 
comprenant au moins une sequence nucleotidique codant un domaine 
catalytique ayant au moins 50 %, et de preference au moins 80 % d'identite 
avec la sequence ID n° 3, et situe en 3* d'une sequence codant un domaine 
de liaison au glucane. 
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10. Acide nucleique selon la revendication 9 comprenant : 

a) deux sequences codant des domaines catalytiques ayant 
au moins 50 %, et de preference au moins 80 % d'identite avec la 
sequence ID n° 3 ; 

5 b) une sequence codant le domaine de liaison au glucane, ce 

dernier etant situe de preference entre les deux sequences en a). 

11. Acide nucleique isole selon la revendication 10 presentant 
au moins 80 % d'identite avec 

10 a) la sequence ID n° 4 ou ; 

b) le brin complementaire de la sequence en a), ou 

c) une sequence hybridant a) ou b) en conditions stringentes. 

12. Acide nucleique isole selon la revendication 11 constitue 
15 de la sequence ID n° 4 ou son brin complementaire ou de la sequence 

deduite de la degenerescence du code genetique. 

13. Acide nucleique isole selon la revendication 1 1 

comprenant : 

20 a) une sequence ayant au moins 80 % d'identite avec la 

sequence codant une dextrane saccharase exprimee par le plasmide pCR- 
T7-cterD depose a la CNCM le 15 mars 2001 sous le numero I-2649, ou 
b) une sequence complementaire de la sequence en a). 

25 14. Vecteur d'expression comprenant un acide nucleique 

selon Tune quelconque des revendications 9 a 13. 

15. Vecteur selon la revendication 14 dans lequel I'acide 
nucleique est sous le controle de sequence permettant son expression 
30 dans des cellules procaryotes ou eucaryotes. 
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16. Cellule hote transformee par un acide nucleique selon 
Tune des revendications 9 a 13 ou un vecteur selon Tune des 
revendications 14 a 15. 

5 17. Cellule transformee selon la revendication 16 choisie dans 

un groupe comprenant E. co//, les Leuconostoc, les vegetaux, les 
Lactococcus et les Bacillus ou les levures. 

18 cellule transformee selon la revendication 17 caracterisee 
10 en ce qu'il s'agit d'une souche de E coli d§posee a la CNCM le 
15 mars 2001 sous le n° I-2649. 

19. Procede de production d'une dextrane saccharase apte a 
former des liaisons a1 -> 2 comprenant : 
15 a) I'insertion d'un acide nucleique selon Tune des 

revendications 9 a 13 ou un vecteur selon Tune des revendications 14 a 15 
dans une cellule hote selon la revendication 16; 

b) la purification de I'enzyme a partir d'un extrait cellulaire. 

20 20. Procede selon la revendication 19 dans lequel la cellule 

hote est un procaryote choisi dans un groupe comprenant E. coli, les 
Lactococci, les Bacillus, les Leuconostoc. 

21. Procede selon la revendication 19 dans lequel la cellule 
25 hote est un eucaryote choisi dans un groupe comprenant les levures, les 

champignons, les vegetaux. 

22. Procede d'obtention d'une dextrane saccharase apte a 
former des oligosides ou des dextranes presentant un taux de liaison 

30 a(1 2) superieur a 30 % des liaisons totales comprenant une etape de 
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modification de la sequence ID n° 4 par addition, deletion, mutation a partir 
du moment ou : 

- le cadre de lecture n'est pas modifie, et 

- les acides amines suivants sont conserves apres traduction : 
5 W en positions 425 ou 2122, code par le triplet TGG en 

positions 1273 et 6364, 

E en positions 430, 565, 2127 et 2248 codes par les 
triplets GAA en positions 1288, 1693, 6379 et 6742 
respectivement, 

10 D en positions 487, 489, 527, 638, 2170 et 2210 codes par 

les triplets GAT en positions 1459, 1465, 1579, 1912, 
6508 et 6628 respectivement, 

D en positions 2172 et 2322 codes par les triplets GAT en 
positions 6514 et 6964, 
15 H en position 637 et 2321, codes respectivement par les 

triplets CAT en position 1909 et CAC en position 6961, 
Q en positions 1019 et 2694 codes respectivement par les 
triplets CAA (3055) et CAG (8080). 

20 23. Procede d'obtention d'une gly cosy It ransf erase isolee apte 

a former des oligosides ou des dextranes presentant un taux de liaison 
a(1 -> 2) superieur a 30 % comprenant : 

- une etape de modification aleatoire de la sequence ID n° 4 
et d'etablissement d'une banque de variants, 

25 - une etape depression de ces sequences modifiees dans 

une cellule hote appropriee, un hote abritant un variant, 

- une etape de criblage des hotes exprimant une enzyme apte 
a former plus de 30 % de liaison <x(1 2) sur un substrat approprie, 

- une etape d'isolement du ou des genes ameliores. 
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24. Glycosyltransferase apte a former au moins 30 % de 
liaison a(1 -> 2) susceptible d'etre obtenue par un procede selon Tune des 
revendications 19 a 22. 

5 25. Utilisation d'une glycosyltransferase obtenue par un 

procede selon Tune des revendications 19 a 22 dans la fabrication d'une 
composition a effet prebiotique. 

26. Utilisation d'une glycosyltransferase obtenue par un 
10 procede selon Tune des revendications 19 a 23 dans la fabrication d'une 
composition pharmaceutique ou cosmetique. 
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LISTE DE SEQUENCES 



<110> Centre National de la Recherche Scientifique 

<120> MOLECULE D'ACIDES NUCLEIQUES CODANT UNE 

DEXTRANE-SACCHARASE CATALYSANT LA SYNTHESE DE DEXTRANE 
PORTANT DES RAMIFICATIONS DE TYPE ALPHA- 1,2 OSIDIQUES 

<130> B4787A (INPI) CNRS/INSA TOULOUSE 

<14 0> xxxxxxx 
<141> 2001-12-19 

<150> 0103631 
<151> 2001-03-16 * 

<160> 17 

<170> Patentln Ver. 2.1 



<210> 1 
<211> 855 
<212> PRT 

<213> Acides amines (domaine catalytique n° 2) 

<400> 1 

Asp Met Ser Thr Asn Ala Phe Ser Thr Lys Asn Val Ala Phe Asn His 
15 10 15 

Asp Ser Ser Ser Phe Asp His Thr Val Asp Gly Phe Leu Thr Ala Asp 
20 25 30 

Thr Trp Tyr Arg Pro Lys Ser lie Leu Ala Asn Gly Thr Thr Trp Arg 

35 ~ 40 45 

Asp Ser Thr Asp Lys Asp Met Arg Pro Leu lie Thr Val Trp Trp Pro 
50 55 60 

Asn Lys Asn Val Gin Val Asn Tyr Leu Asn Phe Met Lys Ala Asn Gly 
65 70 75 80 

Leu Leu Thr Thr Ala Ala Gin Tyr Thr Leu His Ser Asp Gin Tyr Asp 
85 90 95 

Leu Asn Gin Ala Ala Gin Asp Val Gin Val Ala lie Glu Arg Arg lie 
100 " 105 110 

Ala Ser Glu His Gly Thr Asp Trp Leu Gin Lys Leu Leu Phe Glu Ser 
115 120 125 

Gin Asn Asn Asn Pro Ser Phe Val Lys Gin Gin Phe lie Trp Asn Lys 
130 135 140 

Asp Ser Glu Tyr His Gly Gly Gly Asp Ala Trp Phe Gin Gly Gly Tyr 
145 150 155 160 
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Leu Lys Tyr Gly Asn Asn Pro Leu Thr Pro Thr Thr Asn Ser Asp Tyr 
165 170 175 

Arg Gin Pro Gly Asn Ala Phe Asp Phe Leu Leu Ala Asn Asp Val Asp 
180 185 190 

Asn Ser Asn Pro Val Val Gin Ala Glu Asn Leu Asn Trp Leu His Tyr 
195 200 205 

Leu Met Asn Phe Gly Thr He Thr Ala Gly Gin Asp Asp Ala Asn Phe 
210 " 215 220 

Aso Ser He Arg He Asp Ala Val Asp Phe He His Asn Asp Thr He 
225 230 235 240 

Gin Arg Thr Tyr Asp Tyr Leu Arg Asp Ala Tyr Gin Val Gin Gin Ser 
245 " 250 255 

Glu Ala Lvs Ala Asn Gin His He Ser Leu Val Glu Ala Gly Leu Asp 
260 265 270 

Ala Gly Thr Ser Thr He His Asn Asp Ala Leu He Glu Ser Asn Leu 
275 280 285 

Arg Glu Ala Ala Thr Leu Ser Leu Thr Asn Glu Pro Gly Lys Asn Lys 
290 295 300 

Pro Leu Thr Asn Met Leu Gin Asp Val Asp Gly Gly Thr Leu He Thr 
305 310 315 320 

Asp His Thr Gin Asn Ser Thr Glu Asn Gin Ala Thr Pro Asn Tyr Ser 
325 330 335 

He He His Ala His Asp Lys Gly Val Gin Glu Lys Val Gly Ala Ala 
340 345 350 

He Thr Asp Ala Thr Gly Ala Asp Trp Thr Asn Phe Thr Asp Glu Gin 
355 360 365 

Leu Lys Ala Gly Leu Glu Leu Phe Tyr Lys Asp Gin Arg Ala Thr Asn 
370 375 380 

Lys Lys Tyr Asn Ser Tyr Asn He Pro Ser He Tyr Ala Leu Met Leu 
385 390 395 400 

Thr Asn Lys Asp Thr Val Pro Arg Met Tyr Tyr Gly Asp Met Tyr Gin 
405 410 415 

Asp Asp Gly Gin Tyr Met Ala Asn Lys Ser He Tyr Tyr Asp Ala Leu 
420 425 430 

Val Ser Leu Met Thr Ala Arg Lys Ser Tyr Val Ser Gly Gly Gin Thr 
435 440 445 

Met Ser Val Asp Asn His Gly Leu Leu Lys Ser Val Arg Phe Gly Lys 
450 455 460 

Asp Ala Met Thr Ala Asn Asp Leu Gly Thr Ser Ala Thr Arg Thr Glu 
465 470 475 480 
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Gly Leu Gly Val He He Gly Asn Asp Pro Lys Leu Gin Leu Asn Asp 
485 490 495 

Ser Asp Lvs Val Thr Leu Asp Met Gly Ala Ala His Lys Asn Gin Lys 
500 505 510 

Tyr Ara Ala Val He Leu Thr Thr Arg Asp Gly Leu Ala Thr Phe Asn 
515 520 525 

Ser Asp Gin Ala Pro Thr Ala Trp Thr Asn Asp Gin Gly Thr Leu Thr 
530 535 540 

Phe Ser Asn Gin Glu He Asn Gly Gin Asp Asn Thr Gin He Arg Gly 
545 550 555 560 

Val Ala Asn Pro Gin Val Ser Gly Tyr Leu Ala Val Trp Val Pro Val 
565 570 575 

Gly Ala Ser Asp Asn Gin Asp Ala Arg Thr Ala Ala Thr Thr Thr Glu 
580 585 590 

Asn His Asp Gly Lys Val Leu His Ser Asn Ala Ala Leu Asp Ser Asn 
595 600 605 

Leu He Tyr Glu Gly Phe Ser Asn Phe Gin Pro Lys Ala Thr Thr His 
610 615 620 

Asp Glu Leu Thr Asn Val Val lie Ala Lys Asn Ala Asp Val Phe Asn 
625 630 635 640 

Asn Trp Gly He Thr Ser Phe Glu Met Ala Pro Gin Tyr Arg Ser Ser 
645 650 655 

Gly Asp His Thr Phe Leu Asp Ser Thr He Asp Asn Gly Tyr Ala Phe 
660 665 670 

Thr Asp Arg Tyr Asp Leu Gly Phe Asn Thr Pro Thr Lys Tyr Gly Thr 
67 5 68 0 68 5 

Asp Gly Asp Leu Arg Ala Thr He Gin Ala Leu His His Ala Asn Met 
690 " 695 700 

Gin Val Met Ala Asp Val Val Asp Asn Gin Val Tyr Asn Leu Pro Gly 
705 710 715 720 

Lys Glu Val Val Ser Ala Thr Arg Ala Gly Val Tyr Gly Asn Asp Asp 
725 730 735 

Ala Thr Gly Phe Gly Thr Gin Leu Tyr Val Thr Asn Ser Val Gly Gly 
740 745 750 

Gly Gin Tyr Gin Glu Lys Tyr Ala Gly Gin Tyr Leu Glu Ala Leu Lys 
755 760 765 

Ala Lys Tyr Pro Asp Leu Phe Glu Gly Lys Ala Tyr Asp Tyr Trp Tyr 
770 775 780 

Lys Asn Tyr Ala Asn Asp Gly Ser Asn Pro Tyr Tyr Thr Leu Ser His 
785 790 795 800 
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Gly Asp Arg Glu Ser lie Pro Ala Asp Val Ala He Lys Gin Trp Ser 
805 810 815 

Ala Lys Tyr Met Asn Gly Thr Asn Val Leu Gly Asn Gly Met Gly Tyr 
820 825 830 

Val Leu Lys Asp Trp His Asn Gly Gin Tyr Phe Lys Leu Asp Gly Asp 
835 S 4 C 845 

Lys Ser Thr Leu Pro Gin He 
850 855 



<210> 2 
<211> 2835 
<212> PRT 

<213> Acides amines (proteine complete DSR-E) 
<400> 2 

Met Arg Asp Met Arg Val He Cys Asp Arg Lys Lys Leu Tyr Lys Ser 
1 1 5 10 15 

Gly Lys Val Leu Val Thr Ala Gly He Phe Ala Leu Met Met Phe Gly 
20 25 30 

Val Thr Thr Ala Ser Val Ser Ala Asn Thr He Ala Val Asp Thr Asn 
35 40 45 

His Ser Arg Thr Ser Ala Gin He Asn Lys Ser Ala Val Asp Lys Val 
50 55 60 

Asn Asp Asp Lys Thr Thr Leu Gly Ala Ala Lys Val Val Ala Val Ala 
65 70 75 80 

Thr Thr Pro Ala Thr Pro Val Ala Asp Lys Thr Val Ser Ala Pro Ala 
85 90 95 

Ala Asp Lys Ala Val Asp Thr Thr Ser Ser Thr Thr Pro Ala Thr Asp 
100 105 110 

Lys Ala Val Asp Thr Thr Pro Thr Thr Pro Ala Ala Asp Lys Ala Val 
115 120 125 

Asp Thr Thr Pro Thr Thr Pro Ala Ala Asp Lys Ala Val Asp Thr Thr 
130 135 140 

Pro Thr Thr Pro Ala Ala Asn Lys Ala Val Asp Thr Thr Pro Ala Thr 
145 150 155 160 

Ala Ala Thr Asp Lys Ala Val Ala Thr Pro Ala Thr Pro Ala Ala Asp 
165 170 175 

Lys Leu Ala Asn Thr Thr Pro Ala Thr Asp Lys Ala Val Ala Thr Thr 
180 185 190 

Pro Ala Thr Pro Val Ala Asn Lys Ala Ala Asp Thr Ser Ser He His 
195 200 205 

Asp Gin Pro Leu Asp Thr Asn Val Pro Thr Asp Lys Ser Ala Asn Leu 
210 " 215 220 
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Val Ser Thr Thr 
225 

Glu Thr Ser His 



Asp Asn Gly Gin 
260 



Val Leu Tyr Phe 
275 

Gin Val Thr Lys 
290 

His Asp Leu Thr 
305 

Ala Asn Ser Trp 



Trp Thr Pro Thr 
340 

Trp Pro Asp Lys 
355 

Val Gly Met Leu 
370 

Ser Thr Leu Thr 
385 

Arg He Gly Val 



Lys Leu He Asp 
420 

Gly Asn Asp His 
435 

Lys Thr Pro Asn 
450 

Thr Asn Gin Thr 
465 

Glu Met Leu Leu 



Ala Glu Gin Leu 
500 

Ala Gin Asn Asp 
515 



Val Asp Asn Val 
530 



Gin Lys Ser Thr 
230 

Leu Gin Glu He 
245 

Val Lys Lys Asn 



Asp Lys Thr Ser 
280 

Gly Leu Val Asn 
2 95 

Ala Asp Asn Phe 
310 

Tyr Arg Pro Lys 
325 

Thr Ala Glu Asp 



Asn Thr Gin Val 
360 

Pro Asp Asp Val 
375 

Asp Ala Ala Met 
390 

Ser Gly Lys Thr 
405 

Ser Gin Ala Asn 



Leu Gin Gly Gly 
440 

Ala Asn Ser Asp 
455 

Gly Gin He Thr 
470 

Ala Asn Asp Val 
485 

Asn Trp Leu His 



Pro Thr Ala Asn 
520 

Asp Ala Asp Leu 
535 



Asp Asn Gin Gin 
235 

Asn Gly Lys Thr 
250 

Phe Thr Ala He 
265 

Gly Glu Leu Thr 



He Asp Asn Ala 
300 

Thr Asn Val Asp 
315 

Asp He Leu Lys 
330 

Phe Arg Pro Leu 
34 5 

Ala Tyr Leu Gin 



Lys Val Ser Asn 
380 

Thr Val Gin Lys 
395 

Asp Trp Leu Lys 
410 

Trp Asn lie Asp 
425 

Ala Leu Leu Tyr 



Tyr Arg Leu Leu 
4 60 

Asp Pro Ser Lys 
475 

Asp Asn Ser Asn 
4 90 

Tyr Met Met Asn 
505 

Phe Asp Gly Tyr 



Leu Gin He Ala 
540 



Val Lys Ser Thr 
240 



Tyr Phe Leu Asp 
255 

lie Asp Gly Lys 
270 

Ala Asn Ala Pro 
285 

His Asn Ala Ala 



Gly. Tyr Leu Thr 
320 

Asn Gly Thr Thr 
335 

Leu Met Ser Trp 
350 

Tyr Met Gin Ser 
365 

Asp Asp Asn Met 



Asn lie Glu Ser 
400 

Gin Asp Met Asn 
415 

Ser Glu Ser Lys 
430 

Val Asn Asp Asp 
445 

Asn Arg Thr Pro 



Gin Gly Gly Tyr 
480 

Pro Val Val Gin 
495 

lie Gly Thr lie 
510 

Arg Val Asp Ala 
525 

Gly Asp Tyr Phe 
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Lys Ala Ala Tyr Gly Thr Gly Lys Thr Glu Ala Asn Ala Asn Asn His 
545 550 555 560 

He Ser He Leu Glu Asp Trp Asp Asn Asn Asp Ser Ala Tyr He Lys 
565 570 575 

Ala His Gly Asn Asn Gin Leu Thr Met Asp Phe Pro Ala His Leu Ala 
580 585 590 

Leu Lys Tyr Ala Leu Asn Met Fro Leu Ala Ala Gin Ser Gly Leu Glu 
595 600 605 

Pro Leu He Asn Thr Ser Leu Val Lys Arg Gly Lys Asp Ala Thr Glu 
610 615 620 

Asn Glu Ala Gin P-ro Asn Tyr Ala Phe He Arg Ala His Asp Ser Glu 
625 630 635 640 

Val Gin Thr Val He Ala Gin He He Lys Asp Lys He Asn Thr Lys 
645 650 655 

Ser Asp Gly Leu Thr Val Thr Pro Asp Glu lie Lys Gin Ala Phe Thr 
660 665 670 

He Tyr Asn Ala Asp Glu Leu Lys Ala Asp Lys Glu Tyr Thr Ala Tyr 
675 680 685 

Asn He Pro Ala Ser Tyr Ala Val Leu Leu Thr Asn Lys Asp Thr Val 
690 695 700 

Pro Arg Val Tyr Tyr Gly Asp Leu Phe Ser Asp Asp Gly Gin Tyr Met 
705 "* 710 715 720 

Ser Gin Lys Ser Pro Tyr Tyr Asp Ala He Thr Ser Leu Leu Lys Ser 
725 730 735 

Arg He Lys Tyr Val Ala Glv Gly Gin Ser Met Asn Met Thr Tyr Leu 
740 745 750 

His Glu Cys Phe Asp Pro Ala Lys Asn Glu Thr Lys Pro Gin Gly Val 
755 760 765 

Leu Thr Ser Val Arg Tyr Gly Lys Gly Ala Met Thr Ala Asp Asp Leu 
770 " 775 780 

Gly Asn Ser Asp Thr Arg Gin Gin Gly He Gly Leu Val He Asn Asn 
785 790 795 800 

Lys Pro Phe Leu Asn Leu Asn Asp Asp Glu Gin He Val Leu Asn Met 
805 810 815 

Gly Ala Ala His Lys Asn Gin Ala Tyr Arg Pro Leu Met Leu Thr Thr 
820 825 830 

Lys Ser Gly Leu Gin He Tyr Asp Lys Asp Ala Gly Ala Pro Val Val 
835 840 845 

Tyr Thr Asn Asp Ala Gly Gin Leu He Phe Lys Ser Asp Met Val Tyr 
850 855 860 
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Gly Val Ser Asn Pro Gin Val Ser Gly Tyr Phe Ala Ala Trp Val Pro 
865 870 875 880 

Val Gly Ala Ser Asp Ser Gin Asp Ala Arg Thr Gin Ser Ser Gin Ser 
885 890 895 

Glu Thr Lys Asp Gly Asp Val Tyr His Ser Asn Ala Ala Leu Asp Ser 
900 905 910 

Asn Val He Tyr Glu Gly Phe Ser Asn Phe Gin Ala Met Pro Glu Lys 
915 920 925 

Asn Asp Asp Phe Thr Asn Val Lys He Ala Gin Asn Ala Lys Leu Phe 
930 935 940 

Lys Asp Leu Gly He Thr Ser Phe Glu Leu Ala Pro Gin Tyr Arg Ser 
945 J 950 955 960 

Ser Thr Asp Asn Ser Phe Leu Asp Ser Val He Gin Asn Gly Tyr Ala 
965 970 975 

Phe Thr Asp Arg Tyr Asp Val Gly Tyr Asn Thr Pro Thr Lys Tyr Gly 
980 985 990 

Thr Val Asp Gin Leu Leu Asp Ser Leu Arg Ala Leu His Ala Gin Gly 
995 1000 1005 

He Gin Ala He Asn Asp Trp Val Pro Asp Gin He Tyr Asn Leu Pro 
1010 1015 1020 

Gly Glu Gin He Val Thr Ala Val Arg Thr Asn Gly Ser Gly Lys Tyr 
1025 1030 1035 1040 

Asp Tyr Asp Ser Val He Asn Asn Thr Leu Tyr Asp Ser Arg Thr Val 
104 5 1050 1055 

Gly Gly Gly Glu Tyr Gin Glu Lys Phe Gly Gly Leu Phe Leu Asp Gin 
1060 1065 1070 

Leu Lys Lys Asp Tyr Pro Ser Leu Phe Glu Thr Lys Gin He Ser Thr 
1075 1080 1085 

Asn Gin Pro Met Asn Pro Asp Val Lys lie Lys Glu Trp Ser Ala Lys 
1090 1095 1100 

Tyr Phe Asn Gly Ser Asn He Gin Gly Arg Gly Ala Trp Tyr Val Leu 
1105 1110 1115 1120 

Lys Asp Trp Ala Thr Asn Gin Tyr Phe Asn Val Ser Ser Asp Asn Gly 
1125 1130 1135 

Phe Leu Pro Lys Gin Leu Leu Gly Glu Lys Thr Ser Thr Gly Phe He 
1140 1145 1150 

Thr Glu Asn Gly Lys Thr Ser Phe Tyr Ser Thr Ser Gly Tyr Gin Ala 
1155 " 1160 1165 

Lys Asp Thr Phe He Gin Asp Gly Thr Asn Trp Tyr Tyr Phe Asp Asn 
1170 1175 1180 
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Ala Gly Tyr Met Leu Thr Gly Lys Gin Asn lie His Asp Lys Asn Tyr 
1185 1190 ' 1195 1200 

Tyr Phe Leu Pro Asn Gly Val Glu Leu Gin Asp Ala Tyr Leu Phe Asp 
1205 1210 1215 

Gly Asn Gin Glu Phe Tyr Tyr Asn Lys Ala Gly Glu Gin Val Met Asn 
1220 1225 1230 

Gin Tyr Tyr Gin Asp Ser Gin Asn Gin Trp His Tyr Phe Phe Glu Asn 
1235 1240 1245 

Gly Arg Met Ala lie Gly Leu Thr Glu Val Pro Asn Ala Asp Gly Thr 
1250 1255 1260 

His Val Thr Gin tyr Phe Asp Ala Asn Gly Val Gin lie Lys Gly Thr 
1265 1270 1275 1280 

Ala lie Lys Asp Gin Asn Asn Gin Leu Arg Tyr Phe Asp Glu Ala Thr 
1285 1290 1295 

Gly Asn Met Val Val Asn Ser Trp Gly Gin Leu Ala Asp Lys Ser Trp 
1300 1305 1310 

Leu Tyr Leu Asn Ala Gin Gly Val Ala Val Thr Gly Asn Gin Lys lie 
1315 1320 1325 

Asp Gly Glu Glu Tyr Tyr Phe Asn Ala Asp Gly Lys Gin Val Lys Gly 
1330 1335 1340 

Asn Ala He He Asp Asn Asn Gly Asp Gin Arg Tyr Tyr Asp Gly Asp 
1345 1350 1355 1360 

Lys Gly Val Met Val Val Asn Ser Trp Gly Glu Leu Pro Asp Gly Ser 
1365 1370 1375 

Trp Leu Tyr Leu Asn Asp Lys Gly He Ala Val Thr Gly Arg Gin Val 
1380 1385 1390 

He Asn Asn Gin Val Asn Phe Phe Gly Asn Asp Gly Lys Gin He Lys 
1395 1400 1405 

Asp Ala Phe Lys Leu Leu Ser Asp Gly Ser Trp Val Tyr Leu Asp Asp 
1410 1415 1420 

Lys Gly Leu He Thr Thr Gly Ala Lys Val He Asn Gly Leu Asn Met 
1425 1430 1435 1440 

Phe Phe Asp Lys Asp Gly His Gin He Lys Gly Asp Ala Ser Thr Asp 
1445 1450 1455 

Ala Asn Gly Lys Arg His Tyr Tyr Asp Lys Asn Asp Gly His Leu Val 
1460 ~ " 1465 1470 

Thr Asn Ser Trp Gly Glu Leu Pro Asp Gly Ser Trp Leu Tyr Leu Glu 
1475 1480 1485 

Glu Gin Gly Asp Ala Val Thr Gly Gin Arg Val He Asp Gly Lys Thr 
1490 1495 1500 
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Arg Tyr Phe Asp Glu Asp Gly Lys Gin He Lys Asn Ser Leu Lys Thr 
1505 1510 1515 1520 

Leu Ala Asn Gly Asp Lys He Tyr Leu Asp Gly Asp Gly Val Ala Ala 
1525 1530 1535 

Thr Gly Leu Gin His Val Gly Asp Lys He Met Tyr Phe Asp Glu Asp 
1540 1545 1550 



Gly Lys Gin Val Val Gly Lys Phe Val Ser Ala Lys Asp Gly Ser Trp 
1555 1560 1565 

Tyr Tyr Leu Asn Gin Asp Gly Val Ala Ala Val Gly Pro Ser Ser He 
1570 1575 1580 

Asn Gly Gin Ser Leu Tyr Phe Asp Gin Asp Gly Lys Gin Val Lys Tyr 
1585 " 1590 1595 1600 

Asn Glu Val Arg Asn Ser Asp Gly Thr Thr Asn Tyr Tyr Thr Gly Leu 
1605 1610 1615 

Thr Gly Glu Lys Leu Thr Gin Asp Phe Gly Glu Leu Pro Asp Gly Ser 
1620 1625 1630 

C 

Trp He Tyr Leu Asp Ala Gin Gly His Thr Val Thr Gly Ala Gin He 
1635 1640 1645 

He Asn Gly Gin Asn Leu Tyr Phe Lys Ala Asp Gly Gin Gin Val Lys 
1650 1655 1660 

Gly His Ala Tyr Thr Asp Gin Leu Gly His Met Arg Phe Tyr Asp Pro 
1665 1670 1675 1680 

Asp Ser Gly Asp Met Leu Ser Asn Arg Phe Glu Gin He Thr Pro Gly 
1685 1690 1695 

Val Trp Ala Tyr Phe Gly Ala Asp Gly Val Ala He Thr Gly Gin His 
1700 1705 1710 

Asp He Asn Gly Gin Lys Leu Phe Phe Asp Glu Thr Gly Tyr Gin Val 
1715 1720 1725 

Lys Gly Ser Gin Arg Thr lie Asp Gly Thr Leu Tyr Ser Phe Asp Ser 
1730 1735 1740 

Gin Thr Gly Asn Gin Lys Arg Val Gin Thr Thr Leu Leu Pro Gin Ala 
1745 1750 1755 1760 

Gly His Tyr He Thr Lys Asn Gly Asn Asp Trp Gin Tyr Asp Thr Asn 
1765 1770 1775 

Gly Glu Leu Ala Lys Gly Leu Arg Gin Asp Ser Asn Gly Lys Leu Arg 
1780 1785 1790 

Tyr Phe Asp Leu Thr Thr Gly He Gin Ala Lys Gly Gin Phe Val Thr 
1795 1800 1805 



He Gly Gin Glu Thr Tyr Tyr Phe Ser Lys Asp His Gly Asp Ala Gin 
1810 " 1815 1820 
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Leu Leu Pro Met Val Thr Glu Gly His Tyr Gly Thr He Thr Leu Lys 
1825 1830 1835 1840 

Gin Gly Gin Asp Thr Lys Thr Ala Trp Val Tyr Arg Asp Gin Asn Asn 
1845 1850 1855 

Thr He Leu Lys Gly Leu Gin Asn He Asn Gly Thr Leu Gin Phe Phe 
I860 1865 1870 

Asp Pro Tyr Thr Gly Glu Gin Leu Lys Gly Gly Val Ala Lys Tyr Asp 
1875 1880 1885 

Asp Lys Leu Phe Tyr Phe Glu Ser Gly Lys Gly Asn Leu Val Ser Thr 
1890 1895 1900 

Val Ala Gly Asp Ttyr Gin Asp Gly His Tyr He Ser Gin Asp Gly Gin 
1905 1910 1915 1920 

Thr Arg Tyr Ala Asp Lys Gin Asn Gin Leu Val Lys Gly Leu Val Thr 
1925 1930 1935 

Val Asn Gly Ala Leu Gin Tyr Phe Asp Asn Ala Thr Gly Asn Gin He 
1940 1945 1950 

Lys Asn Gin Gin Val lie Val Asp Gly Lys Thr Tyr Tyr Phe Asp Asp 
1955 I960 1965 

Lys Gly Asn Gly Glu Tyr Leu Phe Thr Asn Thr Leu Asp Met Ser Thr 
1970 1975 1980 

Asn Ala Phe Ser Thr Lys Asn Val Ala Phe Asn His Asp Ser Ser Ser 
1985 1990 1995 2000 

Phe Asp His Thr Val Asp Gly Phe Leu Thr Ala Asp Thr Trp Tyr Arg 
2005 2010 2015 

Pro Lys Ser He Leu Ala Asn Gly Thr Thr Trp Arg Asp Ser Thr Asp 
2020 2025 2030 

Lys Asp Met Arg Pro Leu He Thr Val Trp Trp Pro Asn Lys Asn Val 
2035 2040 2045 

Gin Val Asn Tyr Leu Asn Phe Met Lys Ala Asn Gly Leu Leu Thr Thr 
2050 "* 2055 2060 

Ala Ala Gin Tyr Thr Leu His Ser Asp Gin Tyr Asp Leu Asn Gin Ala 
2065 ~ 2070 2075 2080 

Ala Gin Asp Val Gin Val Ala He Glu Arg Arg He Ala Ser Glu His 
2085 2090 2095 

Gly Thr Asp Trp Leu Gin Lys Leu Leu Phe Glu Ser Gin Asn Asn Asn 
2100 " 2105 2110 

Pro Ser Phe Val Lys Gin Gin Phe lie Trp Asn Lys Asp Ser Glu Tyr 
2115 2120 2125 

His Gly Gly Gly Asp Ala Trp Phe Gin Gly Gly Tyr Leu Lys Tyr Gly 
2130 2135 2140 
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Asn Asn Pro Leu Thr Pro Thr Thr Asn Ser Asp Tyr Arg Gin Pro Gly 
2145 2150 2155 2160 

Asn Ala Phe Asp Phe Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro 
2165 2170 2175 

Val Val Gin Ala Glu Asn Leu Asn Trp Leu His Tyr Leu Met Asn Phe 
2180 2185 2190 

Gly Thr He Thr Ala Gly Gin Asp Asp Ala Asn Phe Asp Ser He Arg 
2195 2200 2205 

He Asp Ala Val Asp Phe He His Asn Asp Thr lie Gin Arg Thr Tyr 
2210 2215 2220 

Asp Tyr Leu Arg Asp Ala Tyr Gin Val Gin Gin Ser Glu Ala Lys Ala 
2225 2230 2235 2240 

Asn Gin His He Ser Leu Val Glu Ala Gly Leu Asp Ala Gly Thr Ser 
2245 2250 2255 

Thr He His Asn Asp Ala Leu lie Glu Ser Asn Leu Arg Glu Ala Ala 
2260 2265 2270 

Thr Leu Ser Leu Thr Asn Glu Pro Gly Lys Asn Lys Pro Leu Thr Asn 
2275 2280 2285 

Met Leu Gin Asp Val Asp Gly Gly Thr Leu He Thr Asp His Thr Gin 
2290 2295 2300 

Asn Ser Thr Glu Asn Gin Ala Thr Pro Asn Tyr Ser lie lie His Ala 
2305 2310 2315 2320 

His Asp Lys Gly Val Gin Glu Lys Val Gly Ala Ala lie Thr Asp Ala 
2325 2330 2335 

Thr Gly Ala Asp Trp Thr Asn Phe Thr Asp Glu Gin Leu Lys Ala Gly 
2340 2345 2350 

Leu Glu Leu Phe Tyr Lys Asp Gin Arg Ala Thr Asn Lys Lys Tyr Asn 
2355 2360 2365 

Ser Tyr Asn lie Pro Ser lie Tyr Ala Leu Met Leu Thr Asn Lys Asp 
2370 2375 "* 2380 

Thr Val Pro Arg Met Tyr Tyr Gly Asp Met Tyr Gin Asp Asp Gly Gin 
2385 2390 2395 2400 

Tyr Met Ala Asn Lys Ser lie Tyr Tyr Asp Ala Leu Val Ser Leu Met 
2405 2410 2415 

Thr Ala Arg Lys Ser Tyr Val Ser Gly Gly Gin Thr Met Ser Val Asp . 
2420 2425 2430 

Asn His Gly Leu Leu Lys Ser Val Arg Phe Gly Lys Asp Ala Met Thr 
2435 2440 2445 

Ala Asn Asp Leu Gly Thr Ser Ala Thr Arg Thr Glu Gly Leu Gly Val 
2450 2455 2460 
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He He Gly Asn Asp Pro Lys Leu Gin Leu Asn Asp Ser Asp Lys Val 
2465 2470 2475 2480 

Thr Leu Asp Met Gly Ala Ala His Lys Asn Gin Lys Tyr Arg Ala Val 
2485 2490 2495 

He Leu Thr Thr Arg Asp Gly Leu Ala Thr Phe Asn Ser Asp Gin Ala 
2500 " 2505 2510 

Pro Thr Ala Trp Thr Asn Asp Gin Gly Thr Leu Thr Phe Ser Asn Gin 
2515 2520 2525 

Glu He Asn Gly Gin Asp Asn Thr Gin He Arg Gly Val Ala Asn Pro 
2530 2535 2540 

Gin Val Ser Gly T-yr Leu Ala Val Trp Val Pro Val Gly Ala Ser Asp 
2545 2550 2555 2560 

Asn Gin Asp Ala Arg Thr Ala Ala Thr Thr Thr Glu Asn His Asp Gly 
2565 2570 2575 

Lys Val Leu His Ser Asn Ala Ala Leu Asp Ser Asn Leu He Tyr Glu 
2580 2585 2590 

Gly Phe Ser Asn Phe Gin Pro Lys Ala Thr Thr His Asp Glu Leu Thr 
2595 2600 2605 

Asn Val Val He Ala Lys Asn Ala Asp Val Phe Asn Asn Trp Gly He 
2610 2615 2620 

Thr Ser Phe Glu Met Ala Pro Gin Tyr Arg Ser Ser Gly Asp His Thr 
2625 2630 2635 2640 

Phe Leu Asp Ser Thr He Asp Asn Gly Tyr Ala Phe Thr Asp Arg Tyr 
2645 2650 2655 

Asp Leu Gly Phe Asn Thr Pro Thr Lys Tyr Gly Thr Asp Gly Asp Leu 
2660 2665 2670 

Arg Ala Thr He Gin Ala Leu His His Ala Asn Met Gin Val Met Ala 
2675 2680 2685 

Asp Val Val Asp Asn Gin Val Tyr Asn Leu Pro Gly Lys Glu Val Val 
2690 ~ 2695 2700 

Ser Ala Thr Arg Ala Gly Val Tyr Gly Asn Asp Asp Ala Thr Gly Phe 
2705 2710 2715 2720 

Gly Thr Gin Leu Tyr Val Thr Asn Ser Val Gly Gly Gly Gin Tyr Gin 
2725 2730 2735 

Glu Lys Tyr Ala Gly Gin Tyr Leu Glu Ala Leu Lys Ala Lys Tyr Pro 
2740 2745 2750 

Asp Leu Phe Glu Gly Lys Ala Tyr Asp Tyr Trp Tyr Lys Asn Tyr Ala 
2755 2760 2765 

Asn Asp Gly Ser Asn Pro Tyr Tyr Thr Leu Ser His Gly Asp Arg Glu 
2770 " 2775 2780 
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Ser He Pro Ala Asp Val Ala He Lys Gin Trp Ser Ala Lys Tyr Met 
2785 2790 2795 2800 

Asn Gly Thr Asn Val Leu Gly Asn Gly Met Gly Tyr Val Leu Lys Asp 
2805 2810 2815 

Trp His Asn Gly Gin Tyr Phe Lys Leu Asp Gly Asp Lys Ser Thr Leu 
2820 2825 2830 



Pro Gin He 
2835 



<210> 3 
<211> 2568 
<212> ADN 

<213> Nucleotides (domaine catalytique n° 2) 



<400> 3 

gatatgtcta 

ttcgaccata 

ttggctaacg 

gtttggtggc 

ttgttgacaa 

gcacaagatg 

ttacagaaat 

atttggaaca 

ctgaagtatg 

aatgcatttg 

gaaaacttaa 

gacgctaatt 

caacgtactt 

aaccagcaca 

gatgcgttaa 

ggtaaaaata 

gaccatacgc 

cacgataaag 

tggacgaact 

cgcgcaacaa 

acaaacaaag 

tatatggcaa 

agctatgtca 

cgttttggaa 

ggtcttggtg 

acactggata 

cgtgatggtt 

ggaacgttaa 

gttgctaatc 

aatcaagatg 

tcgaatgcgg 

gcaacaacgc 

aattggggta 

ttcttggatt 

aatacaccaa 

catgctaata 

aaagaagttg 

ggaacgcaac 

ggacaatact 

gattattggt 

ggtgaccgtg 



ctaatgcttt 
ctgttgatgg 
ggacaacttg 
caaataagaa 
cagcagcaca 
ttcaagtggc 
tgttgtttga 
aggattctga 
gcaataaccc 
atttcttgct 
actggttaca 
ttgatagtat 
atgattatct 
tttcattggt 
ttgagtcaaa 
aaccattgac 
agaatagtac 
gtgtgcaaga 
ttacagatga 
acaaaaagta 
atactgttcc 
acaagagtat 
gcggtggtca 
aagatgcgat 
tcattattgg 
tgggtgcagc 
tggcaacctt 
cattctcaaa 
cgcaagtttc 
cccgtacagc 
cattagattc 
atgatgaact 
ttacgagttt 
caacgattga 
caaagtatgg 
tgcaagttat 
tttcagcaac 
tctatgtgac 
tagaagctct 
ataagaacta 
aatctatccc 



ttctaccaaa 
cttcttgacg 
gcgtgattcg 
tgttcaagtc 
atacacacta 
cattgaaagg 
atcacaaaat 
atatcatggt 
actcacacca 
agccaacgac 
ttacttaatg 
tcgtattgac 
tcgtgatgct 
tgaagctggc 
cctccgtgaa 
gaatatgcta 
agaaaatcag 
aaaagtaggt 
acagttaaaa 
taatagttat 
tcgtatgtat 
ctactatgat 
aactatgagt 
gacagctaat 
taatgatcca 
acataaaaat 
taattcagat 
tcaagagatt 
tggttatcta 
agcaacgaca 
taaccttatt 
tacgaacgtt 
tgaaatggca 
taatggttat 
cactgatggt 
ggctgacgtt 
acgagcaggt 
taactccgtt 
gaaagcaaag 
tgcaaatgat 
agcagatgtt 



aatgttgcat 
gcagatactt 
actgataagg 
aactacctca 
cattcagatc 
cgcattgcgt 
aataacccat 
ggtggtgatg 
acaactaatt 
gtggataatt 
aactttggca 
gctgtcgact 
tatcaagtgc 
ttagacgcag 
gcagcgacat 
caagacgttg 
gcgacaccaa 
gcagccatta 
gccggattag 
aacataccaa 
tatggggata 
gccttagtgt 
gttgacaatc 
gatttaggta 
aagttgcaac 
caaaagtatc 
caagcaccaa 
aacgggcaag 
gctgtttggg 
acagaaaatc 
tatgaaggtt 
gtaattgcta 
ccacagtacc 
gccttcactg 
gatttgcgtg 
gttgataacc 
gtttatggta 
ggtggtggtc 
tatccagacc 
gggtcaaatc 
gctattaagc 



tcaatcatga 
ggtatcgacc 
atatgcgacc 
acttcatgaa 
aatatgattt 
cagagcatgg 
catttgtgaa 
cttggttcca 
ctgattatcg 
ctaatcctgt 
ccatcactgc 
ttattcataa 
aacaaagtga 
gtacatcaac 
tgtcgttaac 
acggcggtac 
actattcaat 
ctgatgctac 
agctattcta 
gtatttatgc 
tgtatcaaga 
cattaatgac 
atggtttgtt 
catcagctac 
ttaatgattc 
gcgcagttat 
cagcttggac 
acaatacaca 
tgcctgtggg 
atgatggtaa 
tctctaactt 
aaaatgccga 
gttcaagtgg 
atcgctatga 
caacgattca 
aggtctataa 
atgacgacgc 
aataccaaga 
tctttgaggg 
cttactatac 
aatggtcagc 



cagtagcagt 
aaagtcaatt 
attaatcact 
agcaaatggc 
gaaccaagct 
cacagactgg 
gcaacaattc 
aggtggttat 
tcaacctggt 
tgtgcaagct 
gggtcaagat 
tgatacaatc 
agccaaagca 
gattcataat 
aaatgaacct 
gcttatcacc 
tattcacgcg 
tggtgctgat 
taaggatcag 
cctgatgttg 
tgacggacag 
ggctcgtaaa 
gaagagtgtc 
gcgtactgag 
ggataaagtg 
cttaacaaca 
aaacgatcaa 
aattcgtggt 
tgcatcagac 
agtattacac 
ccaacctaag 
tgtcttcaat 
ggaccataca 
cttaggtttc 
agcgctacat 
cttacctggt 
cacgggcttt 
gaaatatgct 
taaggcctat 
attgtcacac 
taagtatatg 



60 

120 

180 

240 

300 

360 

420 

480 

540 

600 

660 

720 

780 

840 

900 

960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2040 

2100 

2160 

2220 

2280 

2340 

2400 

2460 
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aacggcacga acgttttggg caatggtatg ggttatgtat tgaaggattg gcataatggt 2520 
caatatttca agcttgatgg tgataaatca acattacctc aaatttaa 2568 



<210> 4 
<211> 8506 
<212> ADN 

<213> Sequence codant DSR-E 
<400> 4 

atgagagaca tgagggtaat ttgtgaccgt aaaaaattgt acaaatcggg caaagtacta 60 
gtaacagccg gtatttttgc tttgatgatg tttggcgtca caactgctag tgttagtgca 120 
aatacgattg cagttgacac gaatcatagc cgtacttcag cacagattaa taagagtgcc 180 
gttgataagg ttaatgatga caagactact ttaggagcgg caaaagtagt ggcagtagcc 240 
acaacgccag cgacaacggt agcagataaa acagtaagtg cacccgcagc agataaggca 300 
gtagatacaa cgtcatcaac gacacctgca acggataagg cagtagatac aacgccaacg 360 
acacctgcag cagataaggc agtagataca acgccaacga cacctgcagc agataaggca 420 
gtagatacaa cgccaacgac acctgcagca aataaagcag tagatacaac gccagcgacc 480 
gctgcaacag ataaggcggt agccacgcca gccacacctg cagcagataa gctagcaaat 540 
acgacgcctg caacggacaa ggcagtagcc acaacgccag cgacgccggt agcaaataaa 600 
gcagcagaca cgagtagtat tcatgatcaa ccattagata caaatgtgcc aactgataaa 660 
tcagcaaacc tcgtctcgac aacacaaaaa agtacggata atcaacaagt taagtctaca 720 
gaaacatctc atcttcaaga aatcaacggt aaaacctatt ttcttgacga caatggtcaa 780 
gttaaaaaga acttcaccgc tattattgac ggtaaagttc tatactttga taaaacatcc 840 
ggcgaattga ccgcaaatgc accgcaagtt actaagggat tagtaaatat tgataatgca 900 
cataacgcgg ctcatgatct cacagctgat aacttcacaa atgtcgatgg ttacttaaca 960 
gctaacagtt ggtatcgtcc taaggacatc ttaaaaaacg gaacgacctg gacaccaaca 1020 
acagcagaag attttcgacc attgctcatg tcttggtggc cggataagaa tacgcaggta 1080 
gcttatctac aatatatgca atcagttggt atgctacctg acgatgttaa agtatcaaat 1140 
gatgataata tgagcacatt gactgatgct gctatgactg ttcaaaagaa tatcgaatcg 1200 
cgaattggtg tatctggaaa aactgattgg ctcaagcaag atatgaacaa actgattgat 1260 
tcacaggcaa attggaatat tgatagtgaa tcaaagggta atgatcattt acagggtggg 1320 
gcattgttat atgtgaatga tgacaaaaca cctaacgcga actcagatta ccgtctgtta 1380 
aaccgtacac caaccaacca aaccggccaa attactgatc caagtaaaca aggtggatat 1440 
gagatgttat tagctaatga tgttgataat tctaaccctg ttgtacaagc tgagcaattg 1500 
aactggcttc actacatgat gaacattggt actatagctc agaacgaccc aacagctaat 1560 
tttgacggtt atcgtgttga tgcggttgat aacgttgatg ccgatctctt acaaattgct 1620 
ggtgattact ttaaagctgc atacggtact ggtaaaactg aggcaaacgc aaacaatcat 1680 
atttcgatct tggaagattg ggataataat gattctgcgt acattaaagc ccacgggaat 1740 
aaccaattga caatggattt tccagcacac ttggctttga aatacgcctt gaacatgcct 1800 
cttgccgcac aaagtggcct agaaccgcta attaatacaa gtcttgttaa gcgtgggaaa 1860 
gatgccacag aaaatgaagc acaaccaaac tatgccttta tccgtgccca tgatagtgaa 1920 
gtgcagaccg ttattgcaca aattattaag gataaaatta acacaaaatc agacggctta 1980 
actgtaacac cagatgagat taagcaagct ttcactattt acaacgccga tgaattaaaa 2040 
gcagataagg aatatacagc atacaatatt cctgcttctt acgctgtatt gttgacaaac 2100 
aaggatactg tgccacgtgt ttattatggt gatctatttt ctgatgatgg acagtatatg 2160 
tcacagaagt caccatacta tgacgccatt acgtcacttt tgaaaagccg tatcaaatat 2220 
gttgctggtg gtcaaagtat gaatatgacg tacttgcatg agtgctttga tccagcaaaa 2280 
aatgagacaa agccacaagg tgtcttaaca tcagtacgtt acggtaaagg tgcgatgacg 2340 
gctgacgatt tgggtaatag tgacacacgt caacaaggta ttggtttggt gattaataat 2400 
aagccattct tgaatttaaa tgatgatgaa caaattgtgc tcaatatggg tgctgctcac 24 60 
aaaaatcaag cttaccgacc acttatgttg acaacaaaat ctggtcttca aatttacgat 2520 
aaggatgccg gagcgccagt tgtttatact aacgatgctg gtcaacttat ttttaagtca 2580 
gatatggtct atggtgtcag caatccacag gtatctggtt attttgctgc atgggtacca 2640 
gtcggtgcga gtgatagtca agatgctaga acacaaagca gccagtcaga aactaaggat 2700 
ggcgatgtct atcattcaaa tgctgcgctt gattctaatg tgatttatga aggcttctcg 2760 
aatttccaag caatgcctga aaagaatgat gacttcacca acgtaaaaat tgctcaaaat 2820 
gctaaattgt ttaaagattt agggattaca agctttgaat tagcaccgca atatcgttca 2880 
agtacagata atagtttttt ggattcggtt atccaaaacg gctatgcctt tactgatcga 2940 
tatgatgttg gctataatac gccaacaaaa tatggtacag ttgatcaact tctagatagt 3000 
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ctaagagcat 
tataatttac 
gattatgatt 
taccaagaaa 
tttgaaacta 
tggtctgcaa 
aaagactggg 
cagttactgg 
tactcaacaa 
tactttgata 
tatttcttac 
ttttactata 
caatggcatt 
gctgatggca 
gctataaaag 
gttaattcat 
gctgtgactg 
caagttaaag 
aagggtgtca 
aatgacaaag 
ggtaatgatg 
tatttggatg 
ttttttgata 
cgccattatt 
gatggttcat 
gatggcaaga 
ctggccaatg 
catgtgggcg 
gtatcagcaa 
ccaagcagca 
aatgaagttc 
ttaacgcaag 
catacagtaa 
cagcaagtta 
gattcaggtg 
tttggtgctg 
tttgatgaga 
agcttcgatt 
ggtcactata 
aagggtctgc 
caagcgaaag 
ggggatgcgc 
caaggtcaag 
ggattgcaaa 
aagggtggcg 
cttgttagca 
acacgttacg 
ttacaatact 
ggcaagacgt 
gatatgtcta 
ttcgaccata 
ttggctaacg 
gtttggtggc 
ttgttgacaa 
gcacaagatg 
ttacagaaat 
atttggaaca 
ctgaagtatg 
aatgcatttg 
gaaaacttaa 
gacgctaatt 



tacacgcaca 
ctggcgaaca 
cagtgattaa 
agtttggtgg 
agcagatatc 
agtactttaa 
caacaaatca 
gtgaaaaaac 
gtggttatca 
atgcaggcta 
ctaatggtgt 
ataaagctgg 
atttctttga 
cccatgttac 
atcagaataa 
ggggaoagtt 
gtaaccaaaa 
gcaatgcaat 
tggtagttaa 
gtattgctgt 
gtaagcaaat 
ataagggcct 
aagacggtca 
atgacaaaaa 
ggttatatct 
cacgctattt 
gcgataagat 
ataaaatcat 
aagatggttc 
ttaatggaca 
gtaatagtga 
acttcggtga 
ctggtgcaca 
aaggtcatgc 
atatgttgag 
atggtgtggc 
caggatatca 
ctcaaactgg 
tcacgaaaaa 
gtcaagatag 
gccaatttgt 
agttattgcc 
acaccaaaac 
atatcaatgg 
tagcaaagta 
ccgtagcagg 
cagataagca 
ttgataacgc 
actattttga 
ctaatgcttt 
ctgttgatgg 
ggacaacttg 
caaataagaa 
cagcagcaca 
ttcaagtggc 
tgttgtttga 
aggattctga 
gcaataaccc 
atttcttgct 
actggttaca 
ttgatagtat 



aggtattcag 
aatcgtcacc 
taacacgctc 
cctgttctta 
aacgaatcag 
tggttcaaac 
atatttcaat 
aagcaccggc 
agctaaagat 
tatgttgaca 
ggaacttcaa 
ggaacaagtt 
aaatggtcgc 
acaatatttt 
tcaattacgc 
agcagataag 
aattgatggt 
catcgataat 
ttcatggggt 
aacaggccgt 
caaagatgcc 
gataacaact 
tcaaatcaaa 
tgatggtcat 
agaagaacaa 
tgatgaagat 
ttatcttgat 
gtattttgat 
atggtattac 
atcactttac 
tggaacaacc 
actaccagat 
aatcattaac 
ttatactgac 
taatcgcttt 
cataactgga 
agttaaaggt 
taaccaaaaa 
tggtaacgat 
caatggtaag 
tacaattggc 
aatggtcact 
agcctgggtt 
cacgttgcaa 
tgacgacaag 
tgactatcag 
aaatcagctt 
tactggtaac 
cgataaaggc 
ttctaccaaa 
cttcttgacg 
gcgtgattcg 
tgttcaagtc 
atacacacta 
cattgaaagg 
atcacaaaat 
atatcatggt 
actcacacca 
agccaacgac 
ttacttaatg 
tcgtattgac 



gctattaatg 
gcagttcgta 
tatgattcac 
gaccagttga 
ccgatgaatc 
attcaaggtc 
gtgtctagtg 
tttataacag 
acctttattc 
ggtaaacaaa 
gatgcttacc 
atgaaccagt 
atggcaattg 
gatgctaatg 
tattttgatg 
tcttggcttt 
gaagagtact 
aatggtgatc 
gagttgccag 
caagtcatta 
tttaaattat 
ggagccaaag 
ggtgatgcca 
cttgtcacaa 
ggtgatgctg 
ggcaaacaaa 
ggtgatgggg 
gaagatggca 
ttaaatcagg 
tttgatcaag 
aactattaca 
ggttcatgga 
ggtcaaaatc 
caattaggtc 
gaacaaatca 
caacatgaca 
tcgcaacgta 
cgcgtacaga 
tggcagtatg 
ttgcgttact 
caagaaactt 
gaagggcatt 
taccgtgatc 
ttctttgatc 
ctcttttact 
gatggtcatt 
gtaaagggac 
caaataaaaa 
aatggtgaat 
aatgttgcat 
gcagatactt 
actgataagg 
aactacctca 
cattcagatc 
cgcattgcgt 
aataacccat 
ggtggtgatg 
acaactaatt 
gtggataatt 
aactttggca 
gctgtcgact 



actgggtacc 
caaatggttc 
gaacagttgg 
aaaaagatta 
cggatgttaa 
gtggcgcttg 
ataatggatt 
aaaatggtaa 
aagatggaac 
atatccacga 
tttttgatgg 
attatcaaga 
gcctgacaga 
gtgtccaaat 
aggccacagg 
accttaatgc 
acttcaatgc 
aacgttatta 
atggctcatg 
ataatcaagt 
tatccgatgg 
ttatcaatgg 
gcacggatgc 
attcatgggg 
ttactggtca 
ttaaaaatag 
ttgctgcaac 
aacaagttgt 
atggtgttgc 
atggtaaaca 
caggattaac 
tttatcttga 
tttactttaa 
atatgcgttt 
cacctggtgt 
taaatggtca 
caatagatgg 
caacattgtt 
ataccaatgg 
ttgatttgac 
attactttag 
acggtacaat 
aaaataatac 
catatacagg 
ttgaatcagg 
atatttccca 
ttgttactgt 
atcaacaagt 
acttattcac 
tcaatcatga 
ggtatcgacc 
atatgcgacc 
acttcatgaa 
aatatgattt 
cagagcatgg 
catttgtgaa 
cttggttcca 
ctgattatcg 
ctaatcctgt 
ccatcactgc 
ttattcataa 



tgatcaaatt 
aggtaagtac 
gggcggcgaa 
tcctagcttg 
aattaaagaa 
gtatgtactt 
cttgcctaaa 
gacttctttc 
aaattggtat 
taaaaattat 
taatcaagaa 
tagtcaaaat 
agttccgaac 
taaaggcaca 
taatatggtg 
acaaggcgtt 
tgatggtaag 
tgatggtgat 
gttatatttg 
taatttcttt 
ttcatgggtg 
tctaaatatg 
caatggtaag 
tgagttgcca 
acgtgtgatt 
cctaaaaacg 
aggcttacaa 
tggcaagttt 
cgcggttggt 
agttaaatat 
gggtgaaaag 
tgcgcaaggt 
ggctgacggc 
ttatgatcct 
atgggcttac 
gaagctattc 
tacgttatac 
gccacaagca 
tgaactagcg 
aaccggcata 
taaagatcac 
aacactcaag 
tattttgaag 
tgaacaactt 
taaaggtaat 
agatggccaa 
taatggggca 
tattgttgat 
taatacatta 
cagtagcagt 
aaagtcaatt 
attaatcact 
agcaaatggc 
gaaccaagct 
cacagactgg 
gcaacaattc 
aggtggttat 
tcaacctggt 
tgtgcaagct 
gggtcaagat 
tgatacaatc 



3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
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caacgtactt 
aaccagcaca 
gatgcgttaa 
ggtaaaaata 
gaccatacgc 
cacgataaag 
tggacgaact 
cgcgcaacaa 
acaaacaaag 
tatatggcaa 
agctatgtca 
cgttttggaa 
ggtcttggtg 
acactggata 
cgtgatggtt 
ggaacgttaa 
gttgctaatc 
aatcaagatg 
tcgaatgcgg 
gcaacaacgc 
aattggggta 
ttcttggatt 
aatacaccaa 
catgctaata 
aaagaagttg 
ggaacgcaac 
ggacaatact 
gattattggt 
ggtgaccgtg 
aacggcacga 
caatatttca 



atgattatct 
tttcattggt 
ttgagtcaaa 
aaccattgac 
agaatagtac 
gtgtgcaaga 
ttacagatga 
acaaaaagta 
atactgttcc 
acaagagtat 
gcggtggtca 
aagatgcgat 
tcattattgg 
tgggtgcagc 
tggcaacctt 
cattct-caaa 
cgcaagtttc 
cccgtacagc 
cattagattc 
atgatgaact 
ttacgagttt 
caacgattga 
caaagtatgg 
tgcaagttat 
tttcagcaac 
tctatgtgac 
tagaagctct 
ataagaacta 
aatctatccc 
acgttttggg 
agcttgatgg 



tcgtgatgct 
tgaagctggc 
cctccgtgaa 
gaatatgcta 
agaaaatcag 
aaaagtaggt 
acagttaaaa 
taatagt cat 
tcgtatgtat 
ctactatgat 
aactatgagt 
gacagctaat 
taatgatcca 
acataaaaat 
taattcagat 
tcaagagatt 
tggttatcta 
agcaacgaca 
taaccttatt 
tacgaacgtt 
tgaaatggca 
taatggttat 
cactgatggt 
ggctgacgtt 
acgagcaggt 
taactccgtt 
gaaagcaaag 
tgcaaatgat 
agcagatgtt 
caatggtatg 
tgataaatca 



tatcaagtgc 
ttagacgcag 
gcagcgacat 
caagacgttg 
gcgacaccaa 
gcagccatta 
gccggattag 
aacataccaa 
tatggggata 
gccttagtgt 
gttgacaatc 
gatttaggta 
aagttgcaac 
caaaagtatc 
caagcaccaa 
aacgggcaag 
gctgtttggg 
acagaaaatc 
tatgaaggtt 
gtaattgcta 
ccacagtacc 
gccttcactg 
gatttgcgtg 
gttgataacc 
gtttatggta 
ggtggtggtc 
tatccagacc 
gggtcaaatc 
gctattaagc 
ggttatgtat 
acattacctc 



aacaaagtga 
gtacatcaac 
tgtcgttaac 
acggcggtac 
actattcaat 
ctgatgctac 
agctattcta 
gtatttatgc 
tgtatcaaga 
cattaatgac 
atggtttgtt 
catcagctac 
ttaatgattc 
gcgcagttat 
cagcttggac 
acaatacaca 
tgcctgtggg 
atgatggtaa 
tctctaactt 
aaaatgccga 
gttcaagtgg 
atcgctatga 
caacgattca 
aggtctataa 
atgacgacgc 
aataccaaga 
tctttgaggg 
cttactatac 
aatggtcagc 
tgaaggattg 
aaattt 



agccaaagca 
gattcataat 
aaatgaacct 
gcttatcacc 
tattcacgcg 
tggtgctgat 
taaggatcag 
cctgatgttg 
tgacggacag 
ggctcgtaaa 
gaagagtgtc 
gcgtactgag 
ggataaagtg 
cttaacaaca 
aaacgatcaa 
aattcgtggt 
tgcatcagac 
agtattacac 
ccaacctaag 
tgtcttcaat 
ggaccataca 
cttaggtttc 
agcgctacat 
cttacctggt 
cacgggcttt 
gaaatatgct 
taaggcctat 
attgtcacac 
taagtatatg 
gcataatggt 



6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8506 



<210> 5 
<211> 8931 
<212> ADN 
<213> Gene dsr-E 

<400> 5 

aataatctgt ctccattgct ttcaaaataa taatagttaa ttattatcat ggaacaatca 60 

atattttatt tatattcact attgaatatc cttttttgca taaatctcta gagccgattt 120 

tttgggttat acaatgaatt ggtaaaggtt aatcattttt acaaaaccat ggtggttttt 180 

tattttttct aaaattaccg aactagagga agagaaaagg agcaatagtt gtatgagaga 240 

catgagggta atttgtgacc gtaaaaaatt gtacaaatcg ggcaaagtac tagtaacagc 300 

cggtattttt gctttgatga tgtttggcgt cacaactgct agtgttagtg caaatacgat 360 

tgcagttgac acgaatcata gccgtacttc agcacagatt aataagagtg ccgttgataa 420 

ggttaatgat gacaagacta ctttaggagc ggcaaaagta gtggcagtag ccacaacgcc 480 

agcgacaccg gtagcagata aaacagtaag tgcacccgca gcagataagg cagtagatac 540 

aacgtcatca acgacacctg caacggataa ggcagtagat acaacgccaa cgacacctgc 600 

agcagataag gcagtagata caacgccaac gacacctgca gcagataagg cagtagatac 660 

aacgccaacg acacctgcag caaataaagc agtagataca acgccagcga ccgctgcaac 720 

agataaggcg gtagccacgc cagccacacc tgcagcagat aagctagcaa atacgacgcc 780 

tgcaacggac aaggcagtag ccacaacgcc agcgacgccg gtagcaaata aagcagcaga 840 

cacgagtagt attcatgatc aaccattaga tacaaatgtg ccaactgata aatcagcaaa 900 

cctcgtctcg acaacacaaa aaagtacgga taatcaacaa gttaagtcta cagaaacatc 960 

tcatcttcaa gaaatcaacg gtaaaaccta ttttcttgac gacaatggtc aagttaaaaa 1020 

gaacttcacc gctattattg acggtaaagt tctatacttt gataaaacat ccggcgaatt 1080 

gaccgcaaat gcaccgcaag ttactaaggg attagtaaat attgataatg cacataacgc 1140 

ggctcatgat ctcacagctg ataacttcac aaatgtcgat ggttacttaa cagctaacag 1200 

ttggtatcgt cctaaggaca tcttaaaaaa cggaacgacc tggacaccaa caacagcaga 1260 
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agattttcga 
acaatatatg 
tatgagcaca 
tgtatctgga 
aaattggaat 
atatgtgaat 
accaaccaac 
attagctaat 
tcactacatg 
ttatcgtgtt 
ctttaaagct 
cttggaagat 
gacaatggat 
acaaagtggc 
agaaaatgaa 
cgttattgca 
accagatgag 
ggaatataca 
tgtgccacgt 
gtcaccatac 
tggtcaaagt 
aaagccacaa 
tttgggtaat 
cttgaattta 
agcttaccga 
cggagcgcca 
ctatggtgtc 
gagtgatagt 
ctatcattca 
agcaatgcct 
gtttaaagat 
taatagtttt 
tggctataat 
attacacgca 
acctggcgaa 
ttcagtgatt 
aaagtttggt 
taagcagata 
aaagtacttt 
ggcaacaaat 
gggtgaaaaa 
aagtggttat 
taatgcaggc 
acctaatggt 
taataaagct 
ttatttcttt 
cacccatgtt 
agatcagaat 
atggggacag 
tggtaaccaa 
aggcaatgca 
catggtagtt 
aggtattgct 
tggtaagcaa 
tgataagggc 
taaagacggt 
ttatgacaaa 
atggttatat 
gacacgctat 
tggcgataag 
cgataaaatc 



ccattgctca 
caatcagttg 
ttgactgatg 
aaaactgatt 
attgatagtg 
gatgacaaaa 
caaaccggcc 
gatgttgata 
atgaacattg 
gatgcggttg 
gcatacggta 
tgggataata 
tttccagcac 
ctagaaccgc 
gcacaaccaa 
caaatt^atta 
attaagcaag 
gcatacaata 
gtttattatg 
tatgacgcca 
atgaatatga 
ggtgtcttaa 
agtgacacac 
aatgatgatg 
ccacttatgt 
gttgtttata 
agcaatccac 
caagatgcta 
aatgctgcgc 
gaaaagaatg 
ttagggatta 
ttggattcgg 
acgccaacaa 
caaggtattc 
caaatcgtca 
aataacacgc 
ggcctgttct 
tcaacgaatc 
aatggttcaa 
caatatttca 
acaagcaccg 
caagctaaag 
tatatgttga 
gtggaacttc 
ggggaacaag 
gaaaatggtc 
acacaatatt 
aatcaattac 
ttagcagata 
aaaattgatg 
atcatcgata 
aattcatggg 
gtaacaggcc 
atcaaagatg 
ctgataacaa 
catcaaatca 
aatgatggtc 
ctagaagaac 
tttgatgaag 
atttatcttg 
atgtattttg 



tgtcttggtg 
gtatgcLacc 
ctgctatgac 
ggctcaagca 
aatcaaaggg 
cacctaacgc 
aaattactga 
attctaaccc 
gtactatagc 
ataacgttga 
ctggtaaaac 
atgatt.ctgc 
acttggcttt 
taattaatac 
actatgcctt 
aggataaaat 
ctttcactat 
ttcctgcttc 
gtgatctatt 
ttacgtcact 
cgtacttgca 
catcagtacg 
gtcaacaagg 
aacaaattgt 
tgacaacaaa 
ctaacgatgc 
aggtatctgg 
gaacacaaag 
ttgattctaa 
atgacttcac 
caagctttga 
ttatccaaaa 
aatatggtac 
aggctattaa 
ccgcagttcg 
tctatgattc 
tagaccagtt 
agccgatgaa 
acattcaagg 
atgtgtctag 
gctttataac 
atacctttat 
caggtaaaca 
aagatgctta 
ttatgaacca 
gcatggcaat 
ttgatgctaa 
gctattttga 
agtcttggct 
gtgaagagta 
ataatggtga 
gtgagttgcc 
gtcaagtcat 
cctttaaatt 
ctggagccaa 
aaggtgatgc 
atcttgtcac 
aaggtgatgc 
atggcaaaca 
atggtgatgg 
atgaagatgg 



gccggataag 
tgacgatgtt 
tgttcaaaag 
agatatgaac 
taatgatcat 
gaactcagat 
tccaagtaaa 
tgttgtacaa 
tcagaacgac 
tgccgatctc 
tgaggcaaac 
gtacattaaa 
gaaatacgcc 
aagtcttgtt 
tatccgtgcc 
taacacaaaa 
ttacaacgcc 
ttacgctgta 
ttctgatgat 
tttgaaaagc 
tgagtgcttt 
ttacggtaaa 
tattggtttg 
gctcaatatg 
atctggtctt 
tggtcaactt 
ttattttgct 
cagccagtca 
tgtgatttat 
caacgtaaaa 
attagcaccg 
cggctatgcc 
agttgatcaa 
tgactgggta 
tacaaatggt 
acgaacagtt 
gaaaaaagat 
tccggatgtt 
tcgtggcgct 
tgataatgga 
agaaaatggt 
tcaagatgga 
aaatatccac 
cctttttgat 
gtattatcaa 
tggcctgaca 
tggtgtccaa 
tgaggccaca 
ttaccttaat 
ctacttcaat 
tcaacgttat 
agatggctca 
taataatcaa 
attatccgat 
agttatcaat 
cagcacggat 
aaattcatgg 
tgttactggt 
aattaaaaat 
ggttgctgca 
caaacaagtt 



aatacgcagg 
aaagtatcaa 
aatatcgaat 
aaactgattg 
ttacagggtg 
taccgtctgt 
caaggtggat 
gctgagcaat 
ccaacagcta 
ttacaaattg 
gcaaacaatc 
gcccacggga 
ttgaacatgc 
aagcgtggga 
catgatagtg 
tcagacggct 
gatgaattaa 
ttgttgacaa 
ggacagtata 
cgtatcaaat 
gatccagcaa 
ggtgcgatga 
gtgattaata 
ggtgctgctc 
caaatttacg 
atttttaagt 
gcatgggtac 
gaaactaagg 
gaaggcttct 
attgctcaaa 
caatatcgtt 
tttactgatc 
cttctagata 
cctgatcaaa 
tcaggtaagt 
gggggcggcg 
tatcctagct 
aaaattaaag 
tggtatgtac 
ttcttgccta 
aagacttctt 
acaaattggt 
gataaaaatt 
ggtaatcaag 
gatagtcaaa 
gaagttccga 
attaaaggca 
ggtaatatgg 
gcacaaggcg 
gctgatggta 
tatgatggtg 
tggttatatt 
gttaatttct 
ggttcatggg 
ggtctaaata 
gccaatggta 
ggtgagttgc 
caacgtgtga 
agcctaaaaa 
acaggcttac 
gttggcaagt 



tagcttatct 
atgatgataa 
cgcgaattgg 
attcacaggc 
gggcattgtt 
taaaccgtac 
atgagatgtt 
tgaactggct 
attttgacgg 
ctggtgatta 
atatttcgat 
ataaccaatt 
ctcttgccgc 
aagatgccac 
aagtgcagac 
taactgtaac 
aagcagataa 
acaaggatac 
tgtcacagaa 
atgttgctgg 
aaaatgagac 
cggctgacga 
ataagccatt 
acaaaaatca 
ataaggatgc 
cagatatggt 
cagtcggtgc 
atggcgatgt 
cgaatttcca 
atgctaaatt 
caagtacaga 
gatatgatgt 
gtctaagagc 
tttataattt 
acgattatga 
aataccaaga 
tgtttgaaac 
aatggtctgc 
ttaaagactg 
aacagttact 
tctactcaac 
attactttga 
attatttctt 
aattttacta 
atcaatggca 
acgctgatgg 
cagctataaa 
tggttaattc 
ttgctgtgac 
agcaagttaa 
ataagggtgt 
tgaatgacaa 
ttggtaatga 
tgtatttgga 
tgttttttga 
agcgccatta 
cagatggttc 
ttgatggcaa 
cgctggccaa 
aacatgtggg 
ttgtatcagc 



1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
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aaaagatggt 
cattaatgga 
tcgtaatagt 
agacttcggt 
aactggtgca 
taaaggtcat 
tgatatgttg 
tgatggtgtg 
gacaggatat 
ttctcaaact 
tatcacgaaa 
gcgtcaagat 
aggccaattt 
gcagttattg 
agacaccaaa 
aaatatcaat 
cgtagcaaag 
caccgtagca 
cgcagataag 
ctttgat aac 
gtactatttt 
tactaatgct 
tactgttgat 
cgggacaact 
gccaaataag 
aacagcagca 
tgttcaagtg 
attgttgttt 
caaggattct 
tggcaataac 
tgatttcttg 
aaactggtta 
ttttgatagt 
ttatgattat 
catttcattg 
aattgagtca 
taaaccattg 
gcagaatagt 
aggtgtgcaa 
ctttacagat 
aaacaaaaag 
agatactgtt 
aaacaagagt 
cagcggtggt 
aaaagatgcg 
tgtcattatt 
tatgggtgca 
tttggcaacc 
aacattctca 
tccgcaagtt 
tgcccgtaca 
ggcattagat 
gcatgatgaa 
tattacgagt 
ttcaacgatt 
aacaaagtat 
tatgcaagtt 
tgtttcagca 
actctatgtg 
cttagaagct 
gtataagaac 



tcatggtatt 
caatcacttt 
gatggaacaa 
gaactaccag 
caaatcatta 
gcttatactg 
agtaatcgct 
gccataactg 
caagttaaag 
ggtaaccaaa 
aatggtaacg 
agcaatggta 
gttacaattg 
ccaatggtca 
acagcctggg 
ggcacgttgc 
tatgacgaca 
ggtgactatc 
caaaatcagc 
gctactggta 
gacgataaag 
ttttctacca 
ggcttcttga 
tggcgtgatt 
aatgttcaag 
caatacacac 
gccattgaaa 
gaatcacaaa 
gaatatcatg 
ccactcacac 
ctagccaacg 
cattacttaa 
attcgtattg 
cttcgtgatg 
gttgaagctg 
aacctccgtg 
acgaatatgc 
acagaaaatc 
gaaaaagtag 
gaacagttaa 
tataatagtt 
cctcgtatgt 
atctactatg 
caaactatga 
atgacagcta 
ggtaatgatc 
gcacataaaa 
tttaattcag 
aatcaagaga 
tctggttatc 
gcagcaacga 
tctaacctta 
cttacgaacg 
tttgaaatgg 
gataatggtt 
ggcactgatg 
atggctgacg 
acacgagcag 
actaactccg 
ctgaaagcaa 
tatgcaaatg 



acttaaatca 
actttgatca 
ccaactatta 
atggttcatg 
acggtcaaaa 
accaattagg 
ttgaacaaat 
gacaacatga 
gttcgcaacg 
aacgcgtaca 
attggcagta 
agttgcgtta 
gccaagaaac 
ctgaagggca 
tttaccgtga 
aattctttga 
agctctttta 
aggatggtca 
ttgtaaaggg 
accaaataaa 
gcaatggtga 
aaaatgttgc 
cggcagatac 
cgactgataa 
tcaactacct 
tacattcaga 
ggcgcattgc 
ataataaccc 
gtggtggtga 
caacaactaa 
acgtggataa 
tgaactttgg 
acgctgtcga 
cttatcaagt 
gcttagacgc 
aagcagcgac 
tacaagacgt 
aggcgacacc 
gtgcagccat 
aagccggatt 
ataacatacc 
attatgggga 
atgccttagt 
gtgttgacaa 
atgatttagg 
caaagttgca 
atcaaaagta 
atcaagcacc 
ttaacgggca 
tagctgtttg 
caacagaaaa 
tttatgaagg 
ttgtaattgc 
caccacagta 
atgccttcac 
gtgatttgcg 
ttgttgataa 
gtgtttatgg 
ttggtggtgg 
agtatccaga 
atgggtcaaa 



ggatggtgtt 
agatggtaaa 
cacaggatta 
gatttatctt 
tctttacttt 
tcatatgcgt 
cacacctggt 
cataaatggt 
tacaatagat 
gacaacattg 
tgataccaat 
ctttgatttg 
ttattacttt 
ttacggtaca 
tcaaaataat 
tccatataca 
ctttgaatca 
ttatatttcc 
acttgttact 
aaatcaacaa 
atacttattc 
attcaatcat 
ttggtatcga 
ggatatgcga 
caacttcatg 
tcaatatgat 
gtcagagcat 
atcatttgtg 
tgcttggttc 
ttctgattat 
ttctaatcct 
caccatcact 
ctttattcat 
gcaacaaagt 
aggtacatca 
attgtcgtta 
tgacggcggt 
aaactattca 
tactgatgct 
agagctattc 
aagtatttat 
tatgtatcaa 
gtcattaatg 
tcatggtttg 
tacatcagct 
acttaatgat 
tcgcgcagtt 
aacagcttgg 
agacaataca 
ggtgcctgtg 
tcatgatggt 
tttctctaac 
taaaaatgcc 
ccgttcaagt 
tgatcgctat 
tgcaacgatt 
ccaggtctat 
taatgacgac 
tcaataccaa 
cctctttgag 
tccttactat 



gccgcggttg 
caagttaaat 
acgggtgaaa 
gatgcgcaag 
aaggctgacg 
ttttatgatc 
gtatgggctt 
cagaagctat 
ggtacgttat 
ttgccacaag 
ggtgaactag 
acaaccggca 
agtaaagatc 
ataacactca 
actattttga 
ggtgaacaac 
ggtaaaggta 
caagatggcc 
gttaatgggg 
gttattgttg 
actaatacat 
gacagtagca 
ccaaagtcaa 
ccattaatca 
aaagcaaatg 
ttgaaccaag 
ggcacagact 
aagcaacaat 
caaggtggtt 
cgtcaacctg 
gttgtgcaag 
gcgggtcaag 
aatgatacaa 
gaagccaaag 
acgattcata 
acaaatgaac 
acgcttatca 
attattcacg 
actggtgctg 
tataaggatc 
gccctgatgt 
gatgacggac 
acggctcgta 
ttgaagagtg 
acgcgtactg 
tcggataaag 
atcttaacaa 
acaaacgatc 
caaattcgtg 
ggtgcatcag 
aaagtattac 
ttccaaccta 
gatgtcttca 
ggggaccata 
gacttaggtt 
caagcgctac 
aacttacctg 
gccacgggct 
gagaaatatg 
ggtaaggcct 
acattgtcac 



gtccaagcag 
ataatgaagt 
agttaacgca 
gtcatacagt 
gccagcaagt 
ctgattcagg 
actttggtgc 
tctttgatga 
acagcttcga 
caggtcacta 
cgaagggtct 
tacaagcgaa 
acggggatgc 
agcaaggtca 
agggattgca 
ttaagggtgg 
atcttgttag 
aaacacgtta 
cattacaata 
atggcaagac 
tagatatgtc 
gtttcgacca 
ttttggctaa 
ctgtttggtg 
gcttgttgac 
ctgcacaaga 
ggttacagaa 
tcatttggaa 
atctgaagta 
gtaatgcatt 
ctgaaaactt 
atgacgctaa 
tccaacgtac 
caaaccagca 
atgatgcgtt 
ctggtaaaaa 
ccgaccatac 
cgcacgataa 
attggacgaa 
agcgcgcaac 
tgacaaacaa 
agtatatggc 
aaagctatgt 
tccgttttgg 
agggtcttgg 
tgacactgga 
cacgtgatgg 
aaggaacgtt 
gtgttgctaa 
acaatcaaga 
actcgaatgc 
aggcaacaac 
ataattgggg 
cattcttgga 
tcaatacacc 
atcatgctaa 
gtaaagaagt 
ttggaacgca 
ctggacaata 
atgattattg 
acggtgaccg 



4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
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tgaatctatc 
gaacgttttg 
caagcttgat 
ttatcttatc 
tcgtctgtaa 
acaattgtca 



ccagcagatg 
ggcaatggta 
ggtgataaat 
aaattgtagt 
agctatgcta 
acacccacgg 



ttgctattaa 
tgggttatgt 
caacattacc 
gacaaaagtc 
taataacgtt 
tattcgtggc 



gcaatggtca 
attgaaggat 
tcaaatttaa 
gcagatattg 
atgacaaaag 
gaagtgaaga 



gctaagtata 
tggcataatg 
tttattttga 
aatccaatat 
aaaattattt 
ttatggatat 



tgaacggcac 8640 
gtcaatattt 8700 
tagggaacga 87 60 
ctgcgacttt 8820 
taaagttggc 8880 
c 8931 



<210> 6 
<211> 17 
<212> PRT 
<213> Peptides 

<400> 6 

Ala Asn Trp Asn Me Asp Ser Glu Ser Lys Gly Asn Asp His Leu Gin 
15 10 15 

Gly 



<210> 7 
<211> 24 
<212> PRT 
<213> Peptides 

<400> 7 

Gly Gly Tyr Glu Met Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro 
15 10 15 

Val Val Gin Ala Glu Gin Leu Asn 
20 



<210> 8 
<211> 21 
<212> PRT 
<213> Peptides 

<400> 8 

Ala Asn Phe Asp Gly Tyr Arg Val Asp Ala Val Asp Asn Val Asp Ala 
15 10 15 



Asp Leu Leu Gin lie 
20 



<210> 9 
<211> 12 
<212> PRT 
<213> Peptides 

<400> 9 

His lie Ser lie Leu Glu Asp Trp Asp Asn Asn Asp 
15 10 
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<210> 10 
<211> 15 
<212> PRT 
<213> Peptides 



<400> 10 

Tyr Ala Phe He Arg Ala His Asp Ser Glu Val Gin Thr Val He 
15 10 15 



<210> 11 
<211> 8 
<212> PRT 
<213> Peptides 

<400> 11 

Asp Trp Val Pro Asp Gin He Tyr 
1 5 



<210> 12 
<211> 19 
<212> PRT 
<213> Peptides 

<400> 12 

Phe He Trp Asn Lys Asp Ser Glu Tyr His Gly Gly Gly Asp Ala Trp 
15 10 15 



Phe Gin Gly 



<210> 13 
<211> 24 
<212> PRT 
<213> Peptides 

<400> 13 

Asn Ala Phe Asp Phe Leu Leu Ala Asn Asp Val Asp Asn Ser Asn Pro 
15 10 15 

Val Val Gin Ala Glu Asn Leu Asn 
20 



<210> 14 

<211> 13 

<212> PRT 

<213> Peptides 

<400> 14 

Ala Asn Phe Asp Ser He Arg He Asp Ala Val Asp Phe 
1 5 10 



20 
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<210> 15 
<211> 8 
<212> PRT 
<213> Peptides 

<400> 15 

His lie Ser Leu Val Glu Ala Gly 
1 5 



<210> 16 
<211> 8 
<212> PRT 
<213> Peptides 

<400> 16 

Tyr Ser He He His Ala His Asp 
1 5 



<210> 17 
<211> 8 
<212> PRT 
<213> Peptides 

<400> 17 

Asp Val Val Asp Asn Gin Val Tyr 
1 5 
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